improve console output

author olivier <olivier@3bf09e05-f825-4182-b9bc-eedd7160adf0>

Fri, 19 Jun 2009 15:48:14 +0000 (15:48 +0000)

committer olivier <olivier@3bf09e05-f825-4182-b9bc-eedd7160adf0>

Fri, 19 Jun 2009 15:48:14 +0000 (15:48 +0000)
author olivier <olivier@3bf09e05-f825-4182-b9bc-eedd7160adf0>
Fri, 19 Jun 2009 15:48:14 +0000 (15:48 +0000)
committer olivier <olivier@3bf09e05-f825-4182-b9bc-eedd7160adf0>
Fri, 19 Jun 2009 15:48:14 +0000 (15:48 +0000)
diff --git a/trunk/import/migration/migrate.py b/trunk/import/migration/migrate.py

index c7641a99b41c8e9db78fc4b05990ec2fc1c77ff1..ae7bee723c254570f7317926b52caf950be786a4 100644 (file)
--- a/trunk/import/migration/migrate.py
+++ b/trunk/import/migration/migrate.py
@@ -38,6 +38,7 @@ import ConfigParser
  import MySQLdb
  import time
  
+from tasks.core import Logger
  from tasks.api import IDataMigrator, IDataInitializer
  import tasks
  
@@ -64,12 +65,9 @@ class MigrationManager(Component):
                  task = t
  
              if task:                
-                sys.stdout.write("Running %s %s" % (task.get_name(), type))
-                start = time.time()
-                task.setup(self.cfg, self.src_db, self.target_db)
+                task.setup(self.cfg, self.src_db, self.target_db, self.logger)
                  task.process()
                  self.target_db.commit()
-                sys.stdout.write("\t(%.2fs)\n" % (time.time() - start))
                  done.append(task)
  
          return done
@@ -94,6 +92,8 @@ class MigrationManager(Component):
              passwd  = self.cfg.get('target', 'pass'),
              charset = 'utf8')
  
+        self.logger = Logger()            
+
      def run(self, only_task = None):
          """Run all tasks or a single one identified by its name with only_task"""
          self.done = []
@@ -131,7 +131,7 @@ if __name__ == '__main__':
          print "Usage: %s <config_file> [task_name]" % sys.argv[0]
          print "Tasks:"
          for task in manager.list_tasks():
-            print "  %-24s%s" % (task.get_name(), task.__doc__)
+            print "  %-28s%s" % (task.get_name(), task.__doc__)
  
          sys.exit(1)
  
diff --git a/trunk/import/migration/tasks/collections.py b/trunk/import/migration/tasks/collections.py

index 509f38445afb116376259ce316ce84f604d36553..1cb59ea2a410fc06d706b1c40158482cbdc400b9 100644 (file)
--- a/trunk/import/migration/tasks/collections.py
+++ b/trunk/import/migration/tasks/collections.py
@@ -82,9 +82,9 @@ class CollectionsCopyMigrator(DataMigrator):
          count = self.src_cursor.fetchone()[0]
          self.stats = { 'total': count, 'imported': 0, 'ignored': 0}
  
+        self.start(count)
          for offset in range(0, count):
-            if offset % 400 == 0:
-                self.step()
+            self.step(offset)
  
              query = "INSERT INTO %s.media_collections (\n  %s\n)\n" \
                      "SELECT \n  %s\n FROM %s.Support AS s LIMIT %d, 1" % (
@@ -102,11 +102,13 @@ class CollectionsCopyMigrator(DataMigrator):
                  if errno == DUP_ENTRY:
                      self.src_cursor.execute("SELECT Cote FROM %s.Support LIMIT %d, 1" % (self.src_db_name, offset))
                      id = self.src_cursor.fetchone()[0]
-                    print "Collection %s not imported: %s" % (id, errmsg)
+                    self.warn("Collection %s not imported: %s" % (id, errmsg))
                      self.stats['ignored'] += 1
                  else:
                      raise e
  
+        self.end()                    
+
  class CollectionsEnumMapper(EnumMapper):
      """Map simple enumerations into the collections table"""
  
@@ -180,6 +182,7 @@ class CollectionsCodeConverter(DataMigrator):
  
          read_cursor = self.target_db.cursor()
  
+        self.start(self.stats['total'])
          for pattern in self.patterns:
              read_cursor.execute("SELECT old_code FROM media_collections WHERE old_code REGEXP %s", 
                                         (pattern['regex'],))
@@ -189,8 +192,7 @@ class CollectionsCodeConverter(DataMigrator):
                      break
    
                  self.stats['matched'] += 1
-                if self.stats['matched'] % 500 == 0:
-                    self.step()
+                self.step(self.stats['matched'])
  
                  old_code = row[0]
                  match = re.match(pattern['regex'], old_code)
@@ -212,7 +214,7 @@ class CollectionsCodeConverter(DataMigrator):
  
                  if (year == -1 or serial == -1):
                      self.target_cursor.execute("DELETE FROM media_collections WHERE old_code = %s", (old_code,));
-                    print 'Removed record, old code is missing year or serial: %s' % old_code
+                    self.warn('Removed record, old code is missing year or serial: %s' % old_code)
                      self.stats['removed'] += 1
                      continue
          
@@ -246,13 +248,14 @@ class CollectionsCodeConverter(DataMigrator):
                      (errno, errstr) = e
                      if errno == DUP_ENTRY:
                          self.target_cursor.execute("DELETE FROM media_collections WHERE old_code = %s", (old_code,));
-                        print 'Removed record, code conversion caused a duplicate entry: %s -> %s' % (old_code, new_code)
+                        self.warn('Removed record, code conversion caused a duplicate entry: %s -> %s' % (old_code, new_code))
                          self.stats['removed'] += 1
                      else:
                          raise e
  
          self.stats['remaining'] = self.stats['total'] - self.stats['removed']
          self.stats['unmatched'] = self.stats['total'] - self.stats['matched']
+        self.end()
  
  class CollectionsPublishersMapper(DataMigrator):
      """Map publishers and publisher collections into the collections table"""
@@ -291,6 +294,7 @@ class CollectionsPublishersMapper(DataMigrator):
          self.src_cursor.execute("SELECT Cote, TRIM(Editeur), TRIM(Collect_Serie) FROM Support");
  
          i = 0
+        self.start(self.src_cursor.rowcount)
          while True:
              row = self.src_cursor.fetchone()
              if not row:
@@ -308,10 +312,10 @@ class CollectionsPublishersMapper(DataMigrator):
                          if coll_name and len(coll_name):
                              coll_id = publishers[name]['sub'][coll_name]
                      except KeyError:
-                        print "Unknown publisher/collection: '%s' / '%s'" % name, coll_name
+                        self.warn("Unknown publisher/collection: '%s' / '%s'" % name, coll_name)
                      
                  except KeyError:
-                    print "Unknown publisher: '%s'" % name
+                    self.warn("Unknown publisher: '%s'" % name)
  
              elif coll_name and len(coll_name):
                  raise Exception("Row %s has publisher collection '%s' but no publisher" % (old_code, coll_name))
@@ -319,8 +323,7 @@ class CollectionsPublishersMapper(DataMigrator):
              self.target_cursor.execute("UPDATE media_collections SET publisher_id = %s, publisher_collection_id = %s "
                                         "WHERE old_code = %s", (id, coll_id, old_code));
  
-            if i % 500 == 0:
-                self.step()
+            self.step(i)
  
              i += 1
  
@@ -332,6 +335,7 @@ class CollectionsPublishersMapper(DataMigrator):
          self.stats['with_publisher'] = self.target_cursor.fetchone()[0]
          self.target_cursor.execute("SELECT COUNT(*) FROM media_collections WHERE publisher_collection_id IS NOT NULL")
          self.stats['with_collection'] = self.target_cursor.fetchone()[0]
+        self.end()
  
  class CollectionsCollectorNormalizer(DataMigrator):
      """Migrate collector_is_creator flag"""
diff --git a/trunk/import/migration/tasks/core.py b/trunk/import/migration/tasks/core.py

index de61f482f3770add8cdb53af9f21b463d284063c..1e84e2a47eb217de7b31c608663086d6dfa7c637 100644 (file)
--- a/trunk/import/migration/tasks/core.py
+++ b/trunk/import/migration/tasks/core.py
@@ -34,10 +34,12 @@
  import sys
  from telemeta.core import *
  from datetime import date
+from sys import stdout
+import time
  
  class DataMigrationTask(Component):
      
-    def setup(self, cfg, src_db, target_db):
+    def setup(self, cfg, src_db, target_db, logger):
          self.target_db = target_db
          self.target_cursor = target_db.cursor()
          self.src_db = src_db
@@ -45,10 +47,7 @@ class DataMigrationTask(Component):
          self.src_db_name = cfg.get('src', 'name')
          self.target_db_name = cfg.get('target', 'name')
          self.stats = {}
-
-    def step(self):
-        sys.stdout.write('.')
-        sys.stdout.flush()
+        self.logger = logger;
  
      def src(self, query, args = None):
          self.src_cursor.execute(query, args)
@@ -56,6 +55,18 @@ class DataMigrationTask(Component):
      def target(self, query, args = None):
          self.target_cursor.execute(query, args)
  
+    def step(self, position = -1):
+        self.logger.progress(position)
+
+    def start(self, count = 1):
+        self.logger.start(self, count)
+
+    def end(self):
+        self.logger.end()
+
+    def warn(self, msg):
+        self.logger.warn(msg)
+
  class DataMigrator(DataMigrationTask):
  
      def build_assignments(self, map):
@@ -80,9 +91,13 @@ class DataMigrator(DataMigrationTask):
  
          return 0
  
+    def get_type(self):
+        return 'migrator'
  
  class DataInitializer(DataMigrationTask):
-    pass
+
+    def get_type(self):
+        return 'initializer'
  
  class GroupedItemsManager(object):
  
@@ -159,7 +174,10 @@ class EnumMapper(DataMigrator):
                  enum_tables.append(target_base)
              else:
                  enum_tables.append(target_base + 's')
-            
+
+        self.src_cursor.execute("SELECT COUNT(*) FROM %s" % src_table)
+        total = self.src_cursor.fetchone()[0]
+        self.start(total)
          while not offset or self.src_cursor.rowcount:
              self.src_cursor.execute("SELECT %s, %s FROM %s LIMIT %d, %d" % (
                                      src_id_field, ", ".join(src_fields), src_table, offset, buffer_size))
@@ -181,9 +199,80 @@ class EnumMapper(DataMigrator):
                              if self.target_cursor.rowcount > 1:
                                  raise Exception("Updated more than one row, this shouldn't happen..")
                              elif not self.target_cursor.rowcount:
-                                print "Can't find migrated entry: %s" % code
+                                self.warn("Can't find migrated entry: %s" % code)
                          else:
-                            print "Can't find value '%s' in %s" % (value, enum_tables[i])
+                            self.warn("Can't find value '%s' in %s" % (value, enum_tables[i]))
+
+                self.step()           
  
              offset += self.src_cursor.rowcount                
-            self.step()                            
+
+        self.end()
+
+class Logger(object):
+    CESC      = "\x1B["
+    CNOCURSOR = CESC + "?25l"
+    CCURSOR   = CESC + "?25h"
+    CBOLD     = CESC + "1m"
+    CGREEN    = CESC + "32m"
+    CRED      = CESC + "31m"
+    CBLUE     = CESC + "34m"
+    CCYAN     = CESC + "36m"
+    CRESET    = CESC + "0m" + CCURSOR
+
+    def warn(self, message):
+        self.warnings.append(message)
+        if self.need_newline:
+            sys.stdout.write("\n")
+        sys.stdout.write("%s\n" % message)
+        self.need_newline = False
+
+    def color1(self, msg):
+        stdout.write(self.CBOLD + self.CGREEN + msg + self.CRESET)
+
+    def color2(self, msg):
+        stdout.write(self.CBOLD + self.CCYAN + msg + self.CRESET)
+
+    def color3(self, msg):
+        stdout.write(self.CBOLD + self.CRED + msg + self.CRESET)
+
+    def print_progress(self, ratio, start = False):
+        msg = "Running %s %s..." % (self.task.get_name(), self.task.get_type())
+        msg = "%-46s" % msg
+
+        p = ""
+        r = int(round(ratio * 10))
+        for i in range(0, r):
+            p += '='
+        for i in range(r, 10):
+            p += ' '
+
+        self.color1("\r" + msg)
+        self.color2(" [%s] %d%%" % (p, ratio * 100))
+        self.color3(" warnings: %d" % len(self.warnings))
+
+        sys.stdout.flush()
+        self.need_newline = True
+        
+
+    def start(self, task, count = 1):
+        self.start_time = time.time()
+        self.task   = task
+        self.count  = count
+        self.position = 0
+        self.warnings = []
+        self.print_progress(0, True)
+
+    def end(self):
+        self.print_progress(1)
+        self.color2(" (%.2fs)\n" % (time.time() - self.start_time))
+        self.need_newline = False
+        self.task = None
+
+    def progress(self, position = -1):
+        if position == -1:
+            self.position += 1
+        else:
+            self.position = position
+        self.print_progress(float(self.position) / self.count)
+
diff --git a/trunk/import/migration/tasks/dates.py b/trunk/import/migration/tasks/dates.py

index 6b35f5e4c208c0ae1be1287b1b834de29a1a5763..16e684c775ad84550c1be09fa85c311c41bb13c7 100644 (file)
--- a/trunk/import/migration/tasks/dates.py
+++ b/trunk/import/migration/tasks/dates.py
@@ -265,6 +265,7 @@ class ItemsDateConverter(DataMigrator):
          self.src_cursor.execute("SELECT Cote_Phono, Annee_Enreg, Dates_Enregistr FROM Phono")
  
          i = 0
+        self.start(self.src_cursor.rowcount)
          while True:
              row = self.src_cursor.fetchone()
              if not row:
@@ -297,16 +298,16 @@ class ItemsDateConverter(DataMigrator):
                      else:
                          self.stats['nosuchitem'] += 1
                  else:
-                    print "incoherent date (%s): %s -- %s" % (old_code, str(data), str(row))
+                    self.warn("incoherent date (%s): %s -- %s" % (old_code, str(data), str(row)))
                      self.stats['incoherent'] += 1
                      
              else:
-                #print '|%s|' % row[0]
                  self.stats['unparsed'] += 1
  
              i += 1
-            if i % 1000 == 0:
-                self.step()
+            self.step(i)
+
+        self.end()                  
  
  class DateRangeSynchronizer(DataMigrator):
      "Ensures collections recording years contain items recording dates"
@@ -324,6 +325,7 @@ class DateRangeSynchronizer(DataMigrator):
          items_cursor = self.target_db.cursor()
          update_cursor = self.target_db.cursor()
          i = 0
+        self.start(self.target_cursor.rowcount)
          while True:
              row = self.target_cursor.fetchone()
              if not row:
@@ -356,9 +358,10 @@ class DateRangeSynchronizer(DataMigrator):
              if synced:
                  self.stats['synced'] += 1
  
-            if i % 400 == 0:
-                self.step()
+            self.step(i)
              i += 1
+
+        self.end()
                          
              
          
diff --git a/trunk/import/migration/tasks/enums.py b/trunk/import/migration/tasks/enums.py

index c701a46b2a1a03b1e7870da19441a548c213467d..92983c798c4edfacfcdd9f989ba0b9c269693139 100644 (file)
--- a/trunk/import/migration/tasks/enums.py
+++ b/trunk/import/migration/tasks/enums.py
@@ -57,8 +57,8 @@ class SimpleEnumMigrator(DataMigrator):
          return "enumerations"
      
      def process(self):
+        self.start(len(self.map))
          for src in self.map:
-            self.step()
              dest = self.map[src]
              if src == 'Form':
                  src_field = 'Form'
@@ -69,3 +69,7 @@ class SimpleEnumMigrator(DataMigrator):
              self.target_cursor.execute("INSERT INTO `" + dest + "` (value) " + 
                                         "SELECT " + src_field +" FROM " + self.src_db_name + ".`" + src + "`")
  
+            self.step()
+
+        self.end()                                       
+
diff --git a/trunk/import/migration/tasks/ethnic.py b/trunk/import/migration/tasks/ethnic.py

index 34a8bc2bf9d2da7d2a795a0e14f454db849a3cda..01f3d4002c7bca11170342756e6900db49715bbd 100644 (file)
--- a/trunk/import/migration/tasks/ethnic.py
+++ b/trunk/import/migration/tasks/ethnic.py
@@ -40,8 +40,8 @@ class EthnicGroupsMigrator(DataMigrator):
  
      implements(IDataMigrator)
  
-    def setup(self, cfg, src_db, target_db):
-        super(EthnicGroupsMigrator, self).setup(cfg, src_db, target_db)
+    def setup(self, cfg, src_db, target_db, logger):
+        super(EthnicGroupsMigrator, self).setup(cfg, src_db, target_db, logger)
          self.data = GroupedItemsManager()
  
      def get_name(self):
@@ -80,12 +80,16 @@ class EthnicGroupsMigrator(DataMigrator):
                                             "VALUES(%s, %s)", (id, alias))
  
      def process(self):
+        self.start(2)
          self.extract()
+        self.step()
          self.insert()
+        self.step()
          self.stats = {
              'groups':   len(self.data.groups),
              'aliases':  self.data.count_items()
          }
+        self.end()
                      
          
  
diff --git a/trunk/import/migration/tasks/geoethno.py b/trunk/import/migration/tasks/geoethno.py

index 7009a5f28b4f832b637e57710ac67f926e544b05..e1a543334adfd60172324d4f9805282b25439fc7 100644 (file)
--- a/trunk/import/migration/tasks/geoethno.py
+++ b/trunk/import/migration/tasks/geoethno.py
@@ -49,8 +49,8 @@ class GeoEthnoImporter(DataMigrator):
      naliases = 0
      nhistoric_names = 0
  
-    def setup(self, cfg, src_db, target_db):
-        super(GeoEthnoImporter, self).setup(cfg, src_db, target_db)
+    def setup(self, cfg, src_db, target_db, logger):
+        super(GeoEthnoImporter, self).setup(cfg, src_db, target_db, logger)
          self.cursor = self.target_cursor
          self.dom = dom.parse(cfg.get('geoethno', 'xml_file'))
          self.known_types = []
@@ -147,6 +147,7 @@ class GeoEthnoImporter(DataMigrator):
              raise "Can't find tag 'TERMES-SPECIFIQUES' under tag '%s'" % node.nodeName
  
          terms = terms[0]
+        self.step()
  
          for n in terms.childNodes:
              if (n.nodeType == dom.Node.ELEMENT_NODE):
@@ -175,11 +176,10 @@ class GeoEthnoImporter(DataMigrator):
                  self.process_children(n, name)
  
          self.path.pop()       
-        if len(self.path) == 1:
-            self.step()
  
      def process(self):
          self.path = []
+        self.start(len(self.dom.getElementsByTagName('TERMES-SPECIFIQUES')))
          self.process_children(self.dom.getElementsByTagName('GEOETHNO')[0], '')
          self.stats = {
              'types':            len(self.known_types),
@@ -188,10 +188,8 @@ class GeoEthnoImporter(DataMigrator):
              'aliases':          self.naliases,
              'historical names': self.nhistoric_names
          }
+        self.end()
  
-    def warn(self, msg):
-        print u"\nWarning: %s: %s\n" % ("/".join(self.path), msg)
-        
  
  class Error(Exception):
      def __init__(self, importer, msg):
diff --git a/trunk/import/migration/tasks/instruments.py b/trunk/import/migration/tasks/instruments.py

index e1642b364a76491774200cd7c5ef69419b34c662..3d8812e8883aff3435a86fbd8b31032f04168d32 100644 (file)
--- a/trunk/import/migration/tasks/instruments.py
+++ b/trunk/import/migration/tasks/instruments.py
@@ -157,6 +157,8 @@ class InstrumentsThesaurusMigrator(DataMigrator):
              'unparsed'  : 0,
              'duplicate' : 0
          }
+        
+        self.start(self.stats['total'])
  
          unknown_families = []
          while True:
@@ -184,12 +186,15 @@ class InstrumentsThesaurusMigrator(DataMigrator):
                          self.stats['duplicate'] += 1
                  else:
                      if not prefix in unknown_families:
-                        print "Unknown family prefix: " + prefix
+                        self.warn("Unknown family prefix: " + prefix)
                          unknown_families.append(prefix)
                      self.stats['badprefix'] += 1
              else:
-                print "Can't parse instrument code: %s" % code
+                self.warn("Can't parse instrument code: %s" % code)
                  self.stats['unparsed'] += 1
+            self.step()
+
+        self.end()            
  
  class InstrumentAliasesMigrator(DataMigrator):
      """Migrate the instrument aliases"""
@@ -220,12 +225,9 @@ class InstrumentAliasesMigrator(DataMigrator):
          #self.src("SELECT Vernaculaire FROM Vernaculaire")
          instr_cursor = self.src_db.cursor()
  
-        i = 0
          unknown_instruments = []
+        self.start(self.stats['total'])
          while True:
-            if i % 200 == 0:
-                self.step()
-            i += 1
              row = self.src_cursor.fetchone()
              if not row:
                  break
@@ -270,9 +272,13 @@ class InstrumentAliasesMigrator(DataMigrator):
                                              (alias_id, instrument_id))
                                  self.stats['relations'] += 1
                          elif not row[0] in unknown_instruments:
-                            print "No such instrument: %s" % row[0]
+                            self.warn("No such instrument: %s" % row[0])
                              unknown_instruments.append(row[0])
+
+            self.step()
+
          self.stats['badinstruments'] = len(unknown_instruments)
+        self.end()
  
  class ItemPerformancesMigrator(DataMigrator):
      """Migrate items performances"""
@@ -289,6 +295,7 @@ class ItemPerformancesMigrator(DataMigrator):
              'migrated'      : 0,
              'nosuchitem'    : 0
          }
+        self.start(self.stats['total'])
          while True:
              row = self.src_cursor.fetchone()
              if not row:
@@ -331,7 +338,12 @@ class ItemPerformancesMigrator(DataMigrator):
                      self.stats['migrated'] += 1
                  
              else:
-                print "No such item: %s" % oldcode
+                self.warn("No such item: %s" % oldcode)
                  self.stats['nosuchitem'] += 1
  
+            self.step()
+
+        self.end()
+                            
+
  
diff --git a/trunk/import/migration/tasks/items.py b/trunk/import/migration/tasks/items.py

index 651f6259e31dd919a1aba6d6b942068ac3c9dfe2..9eecbf66bc9121e573f3b2269b146a2f40cd94b7 100644 (file)
--- a/trunk/import/migration/tasks/items.py
+++ b/trunk/import/migration/tasks/items.py
@@ -62,6 +62,7 @@ class ItemsCopyMigrator(DataMigrator):
          return "items:copy"
  
      def process(self):
+        self.start()
          assign          = self.build_assignments(self.map)
          target_fields   = [str(a[0]) for a in assign]
          src_fields      = [str(a[1]) for a in assign]
@@ -85,7 +86,7 @@ class ItemsCopyMigrator(DataMigrator):
          self.stats['imported'] = self.target_cursor.fetchone()[0]
          self.stats['ignored'] = self.stats['total'] - self.stats['imported']
  
-        print "Couldn't import the following items, no such (or un-migrated) collection:"
+        self.warn("Couldn't import the following items, no such (or un-migrated) collection:")
  
          query = "SELECT p.Cote_Phono, p.Cote_Support FROM %s.Phono AS p " \
                  "LEFT JOIN media_collections AS c ON p.Cote_Support = c.old_code " \
@@ -97,7 +98,9 @@ class ItemsCopyMigrator(DataMigrator):
              row = self.target_cursor.fetchone()
              if not row:
                  break
-            print "    %s (collection: %s)" % (row[0], row[1])
+            self.warn("    %s (collection: %s)" % (row[0], row[1]))
+
+        self.end()            
  
  class ItemsEnumMapper(EnumMapper):
      """Map simple enumerations into the items table"""
@@ -125,6 +128,7 @@ class ItemsKeywordsMapper(DataMigrator):
          return "items:keywords"
  
      def process(self):
+        self.start(7)
          self.step()
          self.target_cursor.execute("DELETE FROM context_keywords")
          self.target_cursor.execute("INSERT INTO context_keywords (value) "
@@ -169,7 +173,7 @@ class ItemsKeywordsMapper(DataMigrator):
          self.target_cursor.execute(query % self.src_db_name)
          self.stats['nosuchkeyword'] = self.target_cursor.rowcount
          if self.target_cursor.rowcount:
-            print "Unknown keywords:"
+            self.warn("Unknown keywords:")
              query = "SELECT f.Mot_Clef, COUNT(*) FROM %s.Fonction_Usage AS f " \
                      "LEFT JOIN context_keywords AS k ON f.Mot_Clef = k.value " \
                      "WHERE k.value IS NULL AND f.Mot_Clef <> '' GROUP BY f.Mot_Clef"
@@ -178,7 +182,9 @@ class ItemsKeywordsMapper(DataMigrator):
                  row = self.target_cursor.fetchone()
                  if not row:
                      break
-                print "  %s: count=%d" % row
+                self.warn("  %s: count=%d" % row)
+
+        self.end()                
                  
  class ItemsLocationsMapper(DataMigrator):
      """Migrate items locations trying to map them to the Geo Ethno thesaurus"""
@@ -237,12 +243,9 @@ class ItemsLocationsMapper(DataMigrator):
              'nomap'     : 0
          }
  
-        i = 0
          self.target("SET foreign_key_checks = 0")
+        self.start(self.stats['total'])
          while True:
-            if i % 1000 == 0:
-                self.step()
-            i += 1
              row = self.src_cursor.fetchone()
              if not row:
                  break
@@ -278,7 +281,10 @@ class ItemsLocationsMapper(DataMigrator):
              else:
                  self.stats['nomap'] += 1
  
+            self.step()
+
          self.target("SET foreign_key_checks = 1")
+        self.end()
                      
  
  
diff --git a/trunk/import/migration/tasks/publishers.py b/trunk/import/migration/tasks/publishers.py

index 2a0b92904c0e50f6371c96becd2265bafb2341b3..bfa8dfffb3456828bd0a0243048eaf5c468e7c6e 100644 (file)
--- a/trunk/import/migration/tasks/publishers.py
+++ b/trunk/import/migration/tasks/publishers.py
@@ -42,8 +42,8 @@ class PublishersMigrator(DataMigrator):
  
      implements(IDataMigrator)
  
-    def setup(self, cfg, src_db, target_db):
-        super(PublishersMigrator, self).setup(cfg, src_db, target_db)
+    def setup(self, cfg, src_db, target_db, logger):
+        super(PublishersMigrator, self).setup(cfg, src_db, target_db, logger)
          self.data = GroupedItemsManager()
  
      def get_name(self):
@@ -68,10 +68,14 @@ class PublishersMigrator(DataMigrator):
  
  
      def process(self):
+        self.start(2)
          self.extract()
+        self.step()
          self.insert()
+        self.step()
          self.stats = {
              'publishers': len(self.data.groups),
              'collections': self.data.count_items()
          }
+        self.end()
                      
diff --git a/trunk/import/migration/tasks/reset.py b/trunk/import/migration/tasks/reset.py

index 8403f69da96ae4b5680563a0078e260d69774819..3ec4dc873fb5c06efd2c2f618e0c019da17a7dbc 100644 (file)
--- a/trunk/import/migration/tasks/reset.py
+++ b/trunk/import/migration/tasks/reset.py
@@ -81,6 +81,7 @@ class DatabaseResetMigrator(DataInitializer):
      def process(self):
          #self.target_cursor.execute("SHOW TABLES")
          #tables = self.target_cursor.fetchall()
+        self.start(len(self.tables))
          tables = self.tables
          for t in tables:
              #table = t[0]
@@ -91,6 +92,9 @@ class DatabaseResetMigrator(DataInitializer):
              for f in fields:
                  if f[5] == 'auto_increment':
                      self.target_cursor.execute("ALTER TABLE " + table + " AUTO_INCREMENT = 1")
+            self.step()
+
+        self.end()
author	olivier <olivier@3bf09e05-f825-4182-b9bc-eedd7160adf0>
	Fri, 19 Jun 2009 15:48:14 +0000 (15:48 +0000)
committer	olivier <olivier@3bf09e05-f825-4182-b9bc-eedd7160adf0>
	Fri, 19 Jun 2009 15:48:14 +0000 (15:48 +0000)
trunk/import/migration/migrate.py		patch \| blob \| history
trunk/import/migration/tasks/collections.py		patch \| blob \| history
trunk/import/migration/tasks/core.py		patch \| blob \| history
trunk/import/migration/tasks/dates.py		patch \| blob \| history
trunk/import/migration/tasks/enums.py		patch \| blob \| history
trunk/import/migration/tasks/ethnic.py		patch \| blob \| history
trunk/import/migration/tasks/geoethno.py		patch \| blob \| history
trunk/import/migration/tasks/instruments.py		patch \| blob \| history
trunk/import/migration/tasks/items.py		patch \| blob \| history
trunk/import/migration/tasks/publishers.py		patch \| blob \| history
trunk/import/migration/tasks/reset.py		patch \| blob \| history