From c8636f232f5f9fd6f08ed2b41818e783e2e91ca7 Mon Sep 17 00:00:00 2001
From: Thomas Fillon <thomas@parisson.com>
Date: Thu, 26 Sep 2013 15:01:20 +0200
Subject: [PATCH] Further refactoring of analyzer Result. Emphasis on the
 dataMode and timeMode management

---
 tests/test_AnalyzerResult.py |  77 +++---
 timeside/analyzer/core.py    | 501 +++++++++++++++++++++++++----------
 2 files changed, 393 insertions(+), 185 deletions(-)

diff --git a/tests/test_AnalyzerResult.py b/tests/test_AnalyzerResult.py
index 6ee1131..d2a35f8 100755
--- a/tests/test_AnalyzerResult.py
+++ b/tests/test_AnalyzerResult.py
@@ -12,7 +12,7 @@ class TestAnalyzerResult(TestCase):
     """ test AnalyzerResult """
 
     def setUp(self):
-        self.result = newAnalyzerResult()
+        self.result = newAnalyzerResult(dataMode='value', timeMode='framewise')
         from datetime import datetime
         self.result.idMetadata = dict(date=datetime.now().replace(microsecond=0).isoformat(' '),
                                        version=TimeSideVersion,
@@ -21,85 +21,84 @@ class TestAnalyzerResult(TestCase):
                                        name="Foo bar",
                                        unit="foo")
         self.result.audioMetadata = dict(uri='Foo.wav',
-                                         start=0, duration = 20,
+                                         start=0, duration=20,
                                          channels=2)
 
-        self.result.data = dict(dataMode='value')
-
-
     def testOnFloat(self):
         "float result"
-        self.result.data.data = 1.2
+        self.result.data.value = 1.2
 
     def testOnInt(self):
         "integer result"
-        self.result.data.data = 1
+        self.result.data.value = 1
 
     def testOnList(self):
         "list result"
-        self.result.data.data = [1., 2.]
+        self.result.data.value = [1., 2.]
 
     def testOnString(self):
         "string result"
-        self.result.data.data = "hello"
+        self.result.data.value = "hello"
 
     def testOnListOfString(self):
         "list of strings result"
-        self.result.data.data = ["hello", "hola"]
+        self.result.data.value = ["hello", "hola"]
 
     def testOnListOfList(self):
         "list of lists result"
-        self.result.data.data = [[0, 1, 3], [0, 1, 2]]
-        # TODO : @piem, @yomguy : check use case for [[0, 1], [0, 1, 2]]
+        self.result.data.value = [[0, 1], [0, 1, 2]]
 
     def testOnNumpyVectorOfFloat(self):
         "numpy vector of float"
-        self.result.data.data = ones(2, dtype='float') * pi
+        self.result.data.value = ones(2, dtype='float') * pi
 
     def testOnNumpy2DArrayOfFloat64(self):
         "numpy 2d array of float64"
-        self.result.data.data = ones([2, 3], dtype='float64') * pi
+        self.result.data.value = ones([2, 3], dtype='float64') * pi
 
     def testOnNumpy3DArrayOfInt32(self):
         "numpy 3d array of int32"
-        self.result.data.data = ones([2, 3, 2], dtype='int32') * pi
+        self.result.data.value = ones([2, 3, 2], dtype='int32')
 
     def testOnNumpyArrayOfStrings(self):
         "numpy array of strings"
-        self.result.data.data = array(['hello', 'hola'])
+        self.result.data.value = array(['hello', 'hola'])
 
     def testOnEmptyList(self):
         "empty list"
-        self.result.data.data = []
+        self.result.data.value = []
 
     def testOnNone(self):
         "None"
-        self.result.data.data = None
+        self.result.data.value = None
 
     def testOnUnicode(self):
         "None"
-        self.result.data.data = None
+        self.result.data.value = None
 
     def tearDown(self):
         pass
 
-good_numpy_data_types = [
-    'float64',
-    'float32',
-#    'float16',
-    'int64',
-    'int16',
-    'int32',
-    'int8',
-    'uint16',
-    'uint32',
-    'uint64',
-    'uint8',
-]
+#good_numpy_data_types = [
+#    'float64',
+#    'float32',
+##    'float16',
+#    'int64',
+#    'int16',
+#    'int32',
+#    'int8',
+#    'uint16',
+#    'uint32',
+#    'uint64',
+#    'uint8',
+#]
+from timeside.analyzer.core import numpy_data_types as good_numpy_data_types
 
 bad_numpy_data_types = [
     # not understood by json or yaml
     'float128',
+    # Not supported by h5py for version < 2.2
+    'float16',
     # complex can not be serialized in json
     'complex256',
     'complex128',
@@ -112,9 +111,9 @@ bad_numpy_data_types = [
 
 def create_good_method_func(numpy_data_type):
     def method(self):
-        "numpy %s" % numpy_data_type
+        "numpy %s" % str(numpy_data_type)[7:-1]
         import numpy
-        self.result.data.data = getattr(numpy, numpy_data_type)(pi)
+        self.result.data.value = numpy_data_type(pi)
     return method
 
 
@@ -126,13 +125,14 @@ def create_bad_method_func(numpy_data_type):
             data = getattr(numpy, numpy_data_type)(pi)
         except ValueError:
             data = getattr(numpy, numpy_data_type)()
-        self.assertRaises(TypeError, self.result.data.__setattr__, 'data', data)
+        self.assertRaises(TypeError, self.result.data.__setattr__, 'value', data)
     return method
 
 for numpy_data_type in good_numpy_data_types:
     test_method = create_good_method_func(numpy_data_type)
-    test_method.__name__ = 'testOnNumpy_%s' % numpy_data_type
-    test_method.__doc__ = 'groks a numpy %s' % numpy_data_type
+    str_type = str(numpy_data_type)[13:-2] # keep only type string
+    test_method.__name__ = 'testOnNumpy_%s' % str_type
+    test_method.__doc__ = 'groks a numpy %s' % str_type
     setattr(TestAnalyzerResult, test_method.__name__, test_method)
 
 for numpy_data_type in bad_numpy_data_types:
@@ -152,7 +152,6 @@ class TestAnalyzerResultNumpy(TestAnalyzerResult):
         if verbose:
             print '%15s' % 'from numpy:',
             print d_numpy
-
         self.assertEquals(d_numpy, results)
 
 
@@ -204,7 +203,7 @@ class TestAnalyzerResultXml(TestAnalyzerResult):
 
 
 class TestAnalyzerResultJson(TestAnalyzerResult):
-    """ test AnalyzerResult json serialize """
+    """ test AnalyzerResult """
     def tearDown(self):
         results = AnalyzerResultContainer([self.result])
         try:
diff --git a/timeside/analyzer/core.py b/timeside/analyzer/core.py
index d27ecf0..8cf607e 100644
--- a/timeside/analyzer/core.py
+++ b/timeside/analyzer/core.py
@@ -31,7 +31,7 @@ numpy_data_types = [
     #'float128',
     'float64',
     'float32',
-    'float16',
+    #'float16', Not supported by h5py for version < 2.2
     'int64',
     'int16',
     'int32',
@@ -40,13 +40,16 @@ numpy_data_types = [
     'uint32',
     'uint16',
     'uint8',
+    'object_',
+    'string_',
+    'longlong',
     #'timedelta64',
     #'datetime64',
-    #'complex128',',
+    #'complex128',
     #'complex64',
     ]
 numpy_data_types = map(lambda x: getattr(numpy, x), numpy_data_types)
-numpy_data_types += [numpy.ndarray]
+#numpy_data_types += [numpy.ndarray]
 
 
 class MetadataObject(object):
@@ -100,18 +103,38 @@ class MetadataObject(object):
             (name, self.__class__.__name__))
         super(MetadataObject, self).__setattr__(name, value)
 
+    def __delattr__(self, name):
+        if name in self._default_value.keys():
+            new_default_value = self._default_value.copy()
+            del new_default_value[name]
+            super(MetadataObject, self).__setattr__('_default_value',
+                                                    new_default_value)
+            super(MetadataObject, self).__delattr__(name)
+
     def as_dict(self):
         return dict((att, getattr(self, att))
-        for att in self._default_value.keys())
+            for att in self._default_value.keys())
 
     def keys(self):
-        return self.as_dict().keys()
+        return [attr for attr in self._default_value.keys()
+                        if hasattr(self, attr)]
 
     def values(self):
-        return self.as_dict().values()
+        return [self[attr] for attr in self._default_value.keys()
+                        if hasattr(self, attr)]
 
     def items(self):
-        return self.as_dict().items()
+        return [(attr, self[attr]) for attr in self._default_value.keys()
+                        if hasattr(self, attr)]
+
+    def __getitem__(self, key, default=None):
+        try:
+            return getattr(self, key)
+        except AttributeError:
+            return default
+
+    def __setitem__(self, key, value):
+        setattr(self, key, value)
 
     def __repr__(self):
         return '{}({})'.format(
@@ -125,7 +148,7 @@ class MetadataObject(object):
 
     def __eq__(self, other):
         return (isinstance(other, self.__class__)
-            and self.as_dict() == other.as_dict())
+            and all([self[key] == other[key] for key in self.keys()]))
 
     def __ne__(self, other):
         return not(isinstance(other, self.__class__)
@@ -145,10 +168,10 @@ class MetadataObject(object):
         import xml.etree.ElementTree as ET
         import ast
         root = ET.fromstring(xml_string)
-        for key in self.keys():
-            child = root.find(key)
+        for child in root:
+            key = child.tag
             if child.text:
-                self.__setattr__(key, ast.literal_eval(child.text))
+                self[key] = ast.literal_eval(child.text)
 
 
 class IdMetadata(MetadataObject):
@@ -268,39 +291,90 @@ class AnalyzerData(MetadataObject):
 
         Attributes
         ----------
-        data : numpy array or list ?
-        dataType : type
-        dataMode : str
-            dataMode describe the type of the data :
-                - 'value' for values
-                - 'label' for label data
+        data : numpy array
+        time : numpy array of float
+        duration : numpy array of float
+
     '''
     from collections import OrderedDict
     # Define default values
-    _default_value = OrderedDict([('data', None),
-                                  ('dataType', ''),
-                                  ('dataMode', '')])
+    _default_value = OrderedDict([('value', None),
+                                  ('label', []),
+                                  ('time', []),
+                                  ('duration', [])])
 
     def __setattr__(self, name, value):
-    # Set Data with the proper type
-        if name == 'data':
-            if value is None:
-                value = []
-            # make a numpy.array out of list
-            if type(value) is list:
-                value = numpy.array(value)
-            # serialize using numpy
-            if type(value) in numpy_data_types:
-                value = value.tolist()
-            if type(value) not in [list, str, int, long, float, complex, type(None)] + numpy_data_types:
-                raise TypeError('AnalyzerResult can not accept type %s' %
-                type(value))
-
-            # TODO : guess dataType from value and set datType with:
-            #super(AnalyzerData, self).__setattr__('dataType', dataType)
+        if value is not None:
+            # Set Data with the proper type
+            if name == 'value':
+                value = numpy.asarray(value)
+                if value.dtype.type not in numpy_data_types:
+                    raise TypeError(
+                        'AnalyzerResult can not accept type %s for %s' %
+                        (value.dtype.type, name))
+                if value.shape == ():
+                    value.resize((1,))
+
+            elif name == 'label':
+                try:
+                    value = numpy.asarray(value, dtype='int')
+                except ValueError:
+                    raise TypeError(
+                        'AnalyzerResult can not accept type %s for %s' %
+                        (value.dtype.type, name))
+
+            elif name in ['time', 'duration']:
+                try:
+                    value = numpy.asfarray(value)
+                except ValueError:
+                    raise TypeError(
+                        'AnalyzerResult can not accept type %s for %s' %
+                        (value.dtype.type, name))
+            elif name == 'dataType':
+                return
 
         super(AnalyzerData, self).__setattr__(name, value)
 
+    def __eq__(self, other):
+        try:
+            return (isinstance(other, self.__class__) and
+                all([numpy.array_equal (self[key], other[key])
+                        for key in self.keys()]))
+        except AttributeError:
+            #print self
+            #print [self[key] == other[key] for key in self.keys()]
+            return (isinstance(other, self.__class__) and
+                all([bool(numpy.logical_and.reduce((self[key] == other[key]).ravel()))
+                         for key in self.keys()]))
+
+    def __ne__(self, other):
+        return not(isinstance(other, self.__class__) or
+                any([numpy.array_equal (self[key], other[key])
+                        for key in self.keys()]))
+
+    def to_xml(self):
+        import xml.etree.ElementTree as ET
+        root = ET.Element('Metadata')
+
+        for key in self.keys():
+            child = ET.SubElement(root, key)
+            value = getattr(self, key)
+            if value not in [None, []]:
+                child.text = repr(value.tolist())
+                child.set('dtype',value.dtype.__str__())
+
+        return ET.tostring(root, encoding="utf-8", method="xml")
+
+    def from_xml(self, xml_string):
+        import xml.etree.ElementTree as ET
+        import ast
+        root = ET.fromstring(xml_string)
+        for child in root:
+            key = child.tag
+            if child.text:
+                self[key] = numpy.asarray(ast.literal_eval(child.text),
+                                          dtype=child.get('dtype'))
+
 
 class AnalyzerParameters(dict):
 
@@ -322,6 +396,9 @@ class AnalyzerParameters(dict):
             if child.text:
                 self.set(child.tag, ast.literal_eval(child.text))
 
+    def as_dict(self):
+        return self
+
 
 class newAnalyzerResult(MetadataObject):
     """
@@ -329,19 +406,31 @@ class newAnalyzerResult(MetadataObject):
 
     Attributes
     ----------
-    data : MetadataObject
-    idMetadata : MetadataObject
-    audioMetadata : MetadataObject
-    frameMetadata : MetadataObject
-    labelMetadata : MetadataObject
-    parameters : dict
+    dataMode : str
+        dataMode describes the type of data :
+            - 'value' for values
+            - 'label' for label data see LabelMetadata
+    timeMode : str
+        timeMode describes the correspondance between data values and time
+            - 'framewise'
+            - 'global'
+            - 'segment'
+            - 'event'
+    data : AnalyzerData
+    idMetadata : IdMetadata
+    audioMetadata : AudioMetadata
+    frameMetadata : FrameMetadata
+    labelMetadata : LabelMetadata
+    parameters : AnalyzerParameters Object
 
     """
 
     from collections import OrderedDict
     # Define default values as an OrderDict
     # in order to keep the order of the keys for display
-    _default_value = OrderedDict([('idMetadata', None),
+    _default_value = OrderedDict([('dataMode', None),
+                                  ('timeMode', None),
+                                  ('idMetadata', None),
                                   ('data', None),
                                   ('audioMetadata', None),
                                   ('frameMetadata', None),
@@ -349,6 +438,15 @@ class newAnalyzerResult(MetadataObject):
                                   ('parameters', None)
                                   ])
 
+    _validDataMode = ['value', 'label', None]
+    _validTimeMode = ['framewise', 'global', 'segment', 'event', None]
+
+    def __init__(self, dataMode=None,
+                       timeMode=None):
+        super(newAnalyzerResult, self).__init__()
+        self.dataMode = dataMode
+        self.timeMode = timeMode
+
     def __setattr__(self, name, value):
         setFuncDict = {'idMetadata': IdMetadata,
                        'data': AnalyzerData,
@@ -361,31 +459,79 @@ class newAnalyzerResult(MetadataObject):
             setFunc = setFuncDict[name]
             if isinstance(value, setFunc):
                 super(newAnalyzerResult, self).__setattr__(name, value)
+                return
             elif isinstance(value, dict):
-                super(newAnalyzerResult, self).__setattr__(name, setFunc(**value))
-            elif value in [[], None, '']:
+                for (sub_name, sub_value) in value.items():
+                    self[name][sub_name] = sub_value
+                #super(newAnalyzerResult, self).__setattr__(name, setFunc(**value))
+                return
+            elif value is None:
                 super(newAnalyzerResult, self).__setattr__(name, setFunc())
+                return
             else:
                 raise TypeError('Wrong argument')
-        elif name == 'parameters':
-            if value:
-                super(newAnalyzerResult, self).__setattr__(name, value)
+        elif name == 'dataMode':
+            if self[name] is not None:
+                raise AttributeError("The value of attribute ''timeMode'' \\\
+                can not change after setup")
+            if value == 'value':
+                # Initialize data with:
+                    # 'value', 'dataType'
+                # Remove labelMetadata
+                del self.labelMetadata
+                del self.data.label
+            elif value == 'label':
+                # Initialize data with:
+                    # 'label', 'dataType'
+                del self.data.value
+                # TODO : restore labelMetadata if needed
+                # Initialize labelMetadata
+                pass
+            elif value is None:
+                pass
             else:
-                super(newAnalyzerResult, self).__setattr__(name, {})
-
-    def as_dict(self):
-
-        def makeDict(val):
-            if isinstance(val, MetadataObject):
-                return val.as_dict()
-            elif isinstance(val, dict) or val in [None, []]:
-                return val
+                raise ValueError('Argument ''dataMode''=%s should be in %s'
+                                % (value, self._validDataMode))
+        elif name == 'timeMode':
+            if self[name] is not None:
+                raise AttributeError("The value of attribute ''timeMode'' \\\
+                can not change after setup")
+
+            if value == 'framewise':
+                # Initialize frameMetadata
+                # Remove time and duration from data
+                del self.data.time
+                del self.data.duration
+                pass
+            elif value == 'global':
+                # Remove time and duration from data
+                del self.data.time
+                del self.data.duration
+                # Remove frameMetadata
+                del self.frameMetadata
+
+                pass
+            elif value == 'segment':
+                # Remove frameMetadata
+                del self.frameMetadata
+            elif value == 'event':
+                # Remove frameMetadata
+                del self.frameMetadata
+                # Remove duration from data
+                del self.data.duration
+
+                pass
+            elif value is None:
+                pass
             else:
-                print val
-                raise TypeError('Argument must be a dict or a MetadataObject')
+                raise ValueError('Argument ''timeMode''=%s should be in %s'
+                                % (value, self._validTimeMode))
+        super(newAnalyzerResult, self).__setattr__(name, value)
 
-        return dict((att, makeDict(getattr(self, att)))
-        for att in self._default_value.keys())
+    def as_dict(self):
+        return dict([(key, self[key].as_dict())
+                    for key in self.keys() if hasattr(self[key],'as_dict')]+
+            [('dataMode', self.dataMode), ('timeMode', self.timeMode)])
 
     def to_xml(self):
         import xml.etree.ElementTree as ET
@@ -393,8 +539,12 @@ class newAnalyzerResult(MetadataObject):
         root.metadata = {'name': self.idMetadata.name,
                              'id': self.idMetadata.id}
 
-        for key in self._default_value:
-            child = ET.fromstring(getattr(self, key).to_xml())
+        for key in self.keys():
+            if key in ['dataMode', 'timeMode']:
+                child = ET.SubElement(root, key)
+                child.text = str(self[key])
+            else:
+                child = ET.fromstring(self[key].to_xml())
             child.tag = key
             root.append(child)
 
@@ -404,11 +554,15 @@ class newAnalyzerResult(MetadataObject):
         import xml.etree.ElementTree as ET
         root = ET.fromstring(xml_string)
 
-        result = newAnalyzerResult()
-        for key in result.keys():
-            child = root.find(key)
-            child_string = ET.tostring(child)
-            result.__getattribute__(key).from_xml(child_string)
+        dataModeChild = root.find('dataMode')
+        timeModeChild = root.find('timeMode')
+        result = newAnalyzerResult(dataMode=dataModeChild.text,
+                                   timeMode=timeModeChild.text)
+        for child in root:
+            key = child.tag
+            if key not in ['dataMode', 'timeMode']:
+                child_string = ET.tostring(child)
+                result[key].from_xml(child_string)
 
         return result
 
@@ -516,9 +670,7 @@ class AnalyzerResult(object):
     def __repr__(self):
         return self.to_json()
 
-
     def __eq__(self, other):
-
         return (isinstance(other, self.__class__)
             and self.as_dict() == other.as_dict())
 
@@ -527,7 +679,21 @@ class AnalyzerResult(object):
 
 
 class AnalyzerResultContainer(object):
+    '''
+    >>> from timeside.decoder import FileDecoder
+    >>> #from timeside.analyzer.core import Analyzer
+    >>> #from timeside.analyzer import AnalyzerResultContainer, newAnalyzerResult
+    >>> wavFile = 'tests/samples/sweep.wav'
+    >>> d = FileDecoder(wavFile, start=1)
+
+    >>> a = Analyzer()
+    >>> (d|a).run() #doctest: +ELLIPSIS
+    <timeside.core.ProcessPipe object at 0x...>
+    >>> a.new_result() #doctest: +ELLIPSIS
+    newAnalyzerResult(dataMode=None, timeMode=None, idMetadata=IdMetadata(id='', name='', unit='', description='', date='...', version='0.4.4', author='TimeSide'), data=AnalyzerData(data=None, time=None, duration=None, dataType=None), audioMetadata=AudioMetadata(uri='file:///home/thomas/code/timeside/TimeSide/tests/samples/sweep.wav', start=1.0, duration=7.0, channels=None, channelsManagement=''), frameMetadata=FrameMetadata(samplerate=None, blocksize=None, stepsize=None), labelMetadata=LabelMetadata(label=None, description=None, labelType='mono'), parameters={})
+    >>> resContainer = AnalyzerResultContainer()
 
+    '''
     def __init__(self, analyzer_results=None):
         self.results = []
         if analyzer_results is not None:
@@ -545,23 +711,21 @@ class AnalyzerResultContainer(object):
     def __eq__(self, other):
         if hasattr(other, 'results'):
             other = other.results
-
         return self.results == other
 
     def __ne__(self, other):
         return not self.__eq__(other)
 
-    def __ne__(self, other):
-        return not self.__eq__(other)
-
     def add_result(self, analyzer_result):
         if type(analyzer_result) == list:
             for res in analyzer_result:
                 self.add_result(res)
             return
+        # Check result
         if not (isinstance(analyzer_result, AnalyzerResult)
                 or isinstance(analyzer_result, newAnalyzerResult)):
             raise TypeError('only AnalyzerResult can be added')
+
         self.results += [analyzer_result]
 
     def to_xml(self, data_list=None):
@@ -572,7 +736,6 @@ class AnalyzerResultContainer(object):
         root = ET.Element('timeside')
 
         for result in data_list:
-
             if result:
                 root.append(ET.fromstring(result.to_xml()))
 
@@ -580,7 +743,6 @@ class AnalyzerResultContainer(object):
 
     def from_xml(self, xml_string):
         import xml.etree.ElementTree as ET
-        import ast
 
         results = AnalyzerResultContainer()
         # TODO : from file
@@ -593,25 +755,41 @@ class AnalyzerResultContainer(object):
 
         return results
 
-
     def to_json(self):
         #if data_list == None: data_list = self.results
         import simplejson as json
-        return json.dumps([res.as_dict() for res in self])
+
+        # Define Specialize JSON encoder for numpy array
+        def NumpyArrayEncoder(obj):
+            if isinstance(obj, numpy.ndarray):
+                return {'numpyArray': obj.tolist(),
+                        'dtype': obj.dtype.__str__()}
+            raise TypeError(repr(obj) + " is not JSON serializable")
+
+        return json.dumps([res.as_dict() for res in self],
+                           default=NumpyArrayEncoder)
 
     def from_json(self, json_str):
         import simplejson as json
-        results_json = json.loads(json_str)
+
+        # Define Specialize JSON decoder for numpy array
+        def NumpyArrayDecoder(obj):
+            if isinstance(obj, dict) and 'numpyArray' in obj:
+                numpy_obj = numpy.asarray(obj['numpyArray'],
+                                          dtype=obj['dtype'])
+                return numpy_obj
+            else:
+                return obj
+
+        results_json = json.loads(json_str, object_hook=NumpyArrayDecoder)
         results = AnalyzerResultContainer()
         for res_json in results_json:
 
-            res = newAnalyzerResult()
-            res.idMetadata = res_json['idMetadata']
-            res.data = res_json['data']
-            res.audioMetadata = res_json['audioMetadata']
-            res.frameMetadata = res_json['frameMetadata']
-            res.labelMetadata = res_json['labelMetadata']
-            res.parameters = res_json['parameters']
+            res = newAnalyzerResult(dataMode=res_json['dataMode'],
+                                    timeMode=res_json['timeMode'])
+            for key in res_json.keys():
+                if key not in ['dataMode', 'timeMode']:
+                    res[key] = res_json[key]
 
             results.add_result(res)
         return results
@@ -619,28 +797,42 @@ class AnalyzerResultContainer(object):
     def to_yaml(self):
         #if data_list == None: data_list = self.results
         import yaml
+
+        # Define Specialize Yaml encoder for numpy array
+        def numpyArray_representer(dumper, obj):
+            return dumper.represent_mapping(u'!numpyArray',
+                                            {'dtype': obj.dtype.__str__(),
+                                             'array': obj.tolist()})
+
+        yaml.add_representer(numpy.ndarray, numpyArray_representer)
+
         return yaml.dump([res.as_dict() for res in self])
 
     def from_yaml(self, yaml_str):
         import yaml
 
+        # Define Specialize Yaml encoder for numpy array
+        def numpyArray_constructor(loader, node):
+            mapping = loader.construct_mapping(node, deep=True)
+            return numpy.asarray(mapping['array'], dtype=mapping['dtype'])
+
+        yaml.add_constructor(u'!numpyArray', numpyArray_constructor)
+
         results_yaml = yaml.load(yaml_str)
         results = AnalyzerResultContainer()
         for res_yaml in results_yaml:
             res = newAnalyzerResult()
-            for key in res.keys():
-                res.__setattr__(key, res_yaml[key])
+            for key in res_yaml.keys():
+                res[key] = res_yaml[key]
             results.add_result(res)
         return results
 
     def to_numpy(self, output_file, data_list=None):
         if data_list is None:
             data_list = self.results
-        import numpy
         numpy.save(output_file, data_list)
 
     def from_numpy(self, input_file):
-        import numpy
         return numpy.load(input_file)
 
     def to_hdf5(self, output_file, data_list=None):
@@ -649,33 +841,38 @@ class AnalyzerResultContainer(object):
 
         import h5py
 
-        # Open HDF5 file and save dataset
-        h5_file = h5py.File(output_file, 'w')  # overwrite any existing file
-        try:
+        # Open HDF5 file and save dataset (overwrite any existing file)
+        with h5py.File(output_file, 'w') as h5_file:
             for res in data_list:
                 # Save results in HDF5 Dataset
                 group = h5_file.create_group(res.idMetadata.id)
+                group.attrs['dataMode'] = res['dataMode']
+                group.attrs['timeMode'] = res['timeMode']
                 for key in res.keys():
-                    if key == 'data':
-                        dset = group.create_dataset(key,
-                                                      data=res.data.data)
-                        # Save associated metadata
-                        attrs = res.data.keys()
-                        attrs.remove('data')
-                        for name in attrs:
-                            dset.attrs[name] = res.data.__getattribute__(name)
-                    else:
+                    if key not in ['dataMode', 'timeMode', 'data']:
                         subgroup = group.create_group(key)
-                        attrs = res.__getattribute__(key).keys()
+
+                        # Write attributes
+                        attrs = res[key].keys()
                         for name in attrs:
-                            value = res.__getattribute__(key).__getattribute__(name)
-                            if value:
-                                subgroup.attrs[name] = res.__getattribute__(key).__getattribute__(name)
-                #dset.attrs["name"] = data['name']
-        except TypeError:
-            raise
-        finally:
-            h5_file.close()  # Close the HDF5 file
+                            if res[key][name] is not None:
+                                subgroup.attrs[name] = res[key][name]
+
+                # Write Datasets
+                key = 'data'
+                subgroup = group.create_group(key)
+                for dsetName in res[key].keys():
+                    if res[key][dsetName] is not None:
+                        if res[key][dsetName].dtype == 'object':
+                            # Handle numpy type = object as vlen string
+                            subgroup.create_dataset(dsetName,
+                                    data=res[key][dsetName].tolist().__repr__(),
+                                    dtype=h5py.special_dtype(vlen=str))
+                        else:
+                            subgroup.create_dataset(dsetName,
+                                                  data=res[key][dsetName])
+
+
 
     def from_hdf5(self, input_file):
         import h5py
@@ -686,27 +883,31 @@ class AnalyzerResultContainer(object):
         data_list = AnalyzerResultContainer()
         try:
             for (group_name, group) in h5_file.items():
-                result = newAnalyzerResult()
+
+                result = newAnalyzerResult(dataMode=group.attrs['dataMode'],
+                                           timeMode=group.attrs['timeMode'])
                 # Read Sub-Group
                 for subgroup_name, subgroup in group.items():
+                    # Read attributes
+                    for name, value in subgroup.attrs.items():
+                            result[subgroup_name][name] = value
+
                     if subgroup_name == 'data':
-                        dset = subgroup
-                        # Load value from the hdf5 dataset and store in data
-                        # FIXME : the following conditional statement is to prevent
-                        # reading an empty dataset.
-                        # see : https://github.com/h5py/h5py/issues/281
-                        # It should be fixed by the next h5py version
-                        if dset.shape != (0,):
-                            result.data.data = dset[...]
-                        else:
-                            result.data.data = []
-                        # Load Audio metadata
-                        for name, value in dset.attrs.items():
-                            result.data.__setattr__(name, value)
-                    else:
-                        # Load Audio metadata
-                        for name, value in subgroup.attrs.items():
-                            result.__getattribute__(subgroup_name).__setattr__(name, value)
+                        for dsetName, dset in subgroup.items():
+                            # Load value from the hdf5 dataset and store in data
+                            # FIXME : the following conditional statement is to prevent
+                            # reading an empty dataset.
+                            # see : https://github.com/h5py/h5py/issues/281
+                            # It should be fixed by the next h5py version
+                            if dset.shape != (0,):
+                                if h5py.check_dtype(vlen=dset.dtype):
+                                    # to deal with VLEN data used for list of list
+                                    result[subgroup_name][dsetName] = eval(
+                                            dset[...].tolist())
+                                else:
+                                    result[subgroup_name][dsetName] = dset[...]
+                            else:
+                                result[subgroup_name][dsetName] = []
 
                 data_list.add_result(result)
         except TypeError:
@@ -730,12 +931,12 @@ class Analyzer(Processor):
         super(Analyzer, self).setup(channels, samplerate,
                                     blocksize, totalframes)
 
-        # Set default values for output_* attributes
+        # Set default values for result_* attributes
         # may be overwritten by the analyzer
-        self.output_channels = self.input_channels
-        self.output_samplerate = self.input_samplerate
-        self.output_blocksize = self.input_blocksize
-        self.output_stepsize = self.input_blocksize
+        self.result_channels = self.input_channels
+        self.result_samplerate = self.input_samplerate
+        self.result_blocksize = self.input_blocksize
+        self.result_stepsize = self.input_stepsize
 
     def results(self):
         container = AnalyzerResultContainer()
@@ -756,7 +957,8 @@ class Analyzer(Processor):
     def unit():
         return ""
 
-    def new_result(self, dataMode='value', resultType='framewise'):
+    def new_result(self, dataMode=newAnalyzerResult._default_value['dataMode'],
+                         timeMode=newAnalyzerResult._default_value['timeMode']):
         '''
         Create a new result
 
@@ -773,14 +975,16 @@ class Analyzer(Processor):
 
         from datetime import datetime
 
-        result = newAnalyzerResult()
+        result = newAnalyzerResult(dataMode=dataMode, timeMode=timeMode)
         # Automatically write known metadata
         result.idMetadata = IdMetadata(date=datetime.now().replace(microsecond=0).isoformat(' '),
                                        version=TimeSideVersion,
                                        author='TimeSide')
-        result.audioMetadata = AudioMetadata(uri=self.mediainfo()['uri'])
+        result.audioMetadata = AudioMetadata(uri=self.mediainfo()['uri'],
+                                             start=self.mediainfo()['start'],
+                                             duration=self.mediainfo()['duration'])
 
-        result.data = AnalyzerData(dataMode=dataMode)
+        result.data = AnalyzerData()
 
         if dataMode == 'value':
             pass
@@ -790,22 +994,27 @@ class Analyzer(Processor):
             # raise ArgError('')
             pass
 
-        if resultType == 'framewise':
+        if timeMode == 'framewise':
             result.frameMetadata = FrameMetadata(
-                                        samplerate=self.output_samplerate,
-                                        blocksize=self.output_blocksize,
-                                        stepsize=self.input_stepsize)
-        elif resultType == 'value':
+                                        samplerate=self.result_samplerate,
+                                        blocksize=self.result_blocksize,
+                                        stepsize=self.result_stepsize)
+        elif timeMode == 'global':
             # None : handle by data
             pass
-        elif resultType == 'segment':
+        elif timeMode == 'segment':
             # None : handle by data
             pass
-        elif resultType == 'event':
+        elif timeMode == 'event':
             # None : handle by data, duration = 0
             pass
         else:
             # raise ArgError('')
             pass
 
-        return result
\ No newline at end of file
+        return result
+
+
+if __name__ == "__main__":
+    import doctest
+    doctest.testmod()
-- 
2.39.5