]> git.parisson.com Git - telemeta-data.git/commitdiff
raw conversion: collate field names
authorolivier <olivier@3bf09e05-f825-4182-b9bc-eedd7160adf0>
Wed, 4 Mar 2009 16:47:00 +0000 (16:47 +0000)
committerolivier <olivier@3bf09e05-f825-4182-b9bc-eedd7160adf0>
Wed, 4 Mar 2009 16:47:00 +0000 (16:47 +0000)
git-svn-id: http://svn.parisson.org/svn/crem@67 3bf09e05-f825-4182-b9bc-eedd7160adf0

trunk/import/raw_conversion/import

index cd3a50e2d0cc022078e4d019f73ea1c6859c06e5..fc486c7d2772d4cb6a757d03ebbc4aeb8f837e47 100755 (executable)
@@ -10,6 +10,11 @@ function extract_enum
     echo "INSERT INTO \`$to_table\` SELECT DISTINCT \`$from_field\` FROM \`$from_table\` WHERE \`$from_field\` <> '';";
 }
 
+function collate
+{
+    sed 's/é/e/g'
+}
+
 src=$1
 cd $src
 
@@ -23,8 +28,8 @@ do
     table=$(echo $filename | sed 's/.txt//')
     echo "DROP TABLE IF EXISTS \`$table\`;"
     echo "CREATE TABLE \`$table\` ("
-    head -n1 $filename | tr '\t' '\n' | head -n-1 | sed 's/^/    `/' | sed 's/$/` TEXT NOT NULL,/'
-    head -n1 $filename | tr '\t' '\n' | tail -n1 | sed 's/^/    `/' | sed 's/$/` TEXT NOT NULL/'
+    head -n1 $filename | collate | tr '\t' '\n' | head -n-1 | sed 's/^/    `/' | sed 's/$/` TEXT NOT NULL,/'
+    head -n1 $filename | collate | tr '\t' '\n' | tail -n1 | sed 's/^/    `/' | sed 's/$/` TEXT NOT NULL/'
     echo ") CHARSET=latin1;"
     echo
     echo "LOAD DATA INFILE '$src/$filename'"
@@ -37,14 +42,14 @@ do
 done
 
 extract_enum Format Support Format
-extract_enum Reedition Support Réédition
+extract_enum Reedition Support Reedition
 extract_enum Mode_Acqui Support Mode_Acqui
-extract_enum Redacteur_Fiche Support Rédacteur_Fiche
+extract_enum Redacteur_Fiche Support Redacteur_Fiche
 extract_enum Saisie_Fiche Support Saisie_Fiche
 extract_enum Droit_Utiliser Support Droit_Utiliser
 extract_enum Terrain_ou_Autr Support Terrain_ou_Autr
-extract_enum Numerisation Support Numérisation
-extract_enum "FormStyl generi" Phono "FormStyl généri"
+extract_enum Numerisation Support Numerisation
+extract_enum "FormStyl generi" Phono "FormStyl generi"
 extract_enum Editeur1 Support Editeur
-extract_enum Collection_Serie Support Collect_Série
+extract_enum Collection_Serie Support Collect_Serie