]> git.parisson.com Git - pdf.js.git/commitdiff
Light bidi fixes
authornotmasteryet <async.processingjs@yahoo.com>
Tue, 14 Feb 2012 02:28:36 +0000 (20:28 -0600)
committernotmasteryet <async.processingjs@yahoo.com>
Tue, 14 Feb 2012 02:28:36 +0000 (20:28 -0600)
src/bidi.js

index 09f8dd7c6054635c89aae6040c058708105d6815..025847ea9b7b6a534546254880434a6700c06c59 100644 (file)
@@ -1,71 +1,54 @@
+/* -*- Mode: Java; tab-width: 2; indent-tabs-mode: nil; c-basic-offset: 2 -*- */\r
+/* vim: set shiftwidth=2 tabstop=2 autoindent cindent expandtab: */\r
+\r
+'use strict';\r
+\r
+// Character types for symbols from 0000 to 00FF.\r
 var baseTypes = [\r
-  "BN", "BN", "BN", "BN", "BN", "BN", "BN", "BN", "BN", "S", "B", "S", "WS",\r
-  "B", "BN", "BN", /*U+000*/\r
-  "BN", "BN", "BN", "BN", "BN", "BN", "BN", "BN", "BN", "BN", "BN", "BN", "B",\r
-  "B", "B", "S", /*U+001*/\r
-  "WS", "ON", "ON", "ET", "ET", "ET", "ON", "ON", "ON", "ON", "ON", "ON", "CS",\r
-  "ON", "CS", "ON", /*U+002*/\r
-  "EN", "EN", "EN", "EN", "EN", "EN", "EN", "EN", "EN", "EN", "ON", "ON", "ON",\r
-  "ON", "ON", "ON", /*U+003*/\r
-  "ON", "L", "L", "L", "L", "L", "L", "L", "L", "L", "L", "L", "L", "L", "L",\r
-  "L", /*U+004*/\r
-  "L", "L", "L", "L", "L", "L", "L", "L", "L", "L", "L", "ON", "ON", "ON", "ON",\r
-  "ON", /*U+005*/\r
-  "ON", "L", "L", "L", "L", "L", "L", "L", "L", "L", "L", "L", "L", "L", "L",\r
-  "L", /*U+006*/\r
-  "L", "L", "L", "L", "L", "L", "L", "L", "L", "L", "L", "ON", "ON", "ON", "ON",\r
-  "BN", /*U+007*/\r
-  "BN", "BN", "BN", "BN", "BN", "B", "BN", "BN", "BN", "BN", "BN", "BN", "BN",\r
-  "BN", "BN", "BN", /*U+008*/\r
-  "BN", "BN", "BN", "BN", "BN", "BN", "BN", "BN", "BN", "BN", "BN", "BN", "BN",\r
-  "BN", "BN", "BN", /*U+009*/\r
-  "CS", "ON", "ET", "ET", "ET", "ET", "ON", "ON", "ON", "ON", "L", "ON", "ON",\r
-  "ON", "ON", "ON", /*U+00a*/\r
-  "ET", "ET", "EN", "EN", "ON", "L", "ON", "ON", "ON", "EN", "L", "ON", "ON",\r
-  "ON", "ON", "ON", /*U+00b*/\r
-  "L", "L", "L", "L", "L", "L", "L", "L", "L", "L", "L", "L", "L", "L", "L",\r
-  "L", /*U+00c*/\r
-  "L", "L", "L", "L", "L", "L", "L", "ON", "L", "L", "L", "L", "L", "L", "L",\r
-  "L", /*U+00d*/\r
-  "L", "L", "L", "L", "L", "L", "L", "L", "L", "L", "L", "L", "L", "L", "L",\r
-  "L", /*U+00e*/\r
-  "L", "L", "L", "L", "L", "L", "L", "ON", "L", "L", "L", "L", "L", "L", "L",\r
-  "L"   /*U+00f*/\r
+  'BN', 'BN', 'BN', 'BN', 'BN', 'BN', 'BN', 'BN', 'BN', 'S', 'B', 'S', 'WS',\r
+  'B', 'BN', 'BN', 'BN', 'BN', 'BN', 'BN', 'BN', 'BN', 'BN', 'BN', 'BN', 'BN',\r
+  'BN', 'BN', 'B', 'B', 'B', 'S', 'WS', 'ON', 'ON', 'ET', 'ET', 'ET', 'ON',\r
+  'ON', 'ON', 'ON', 'ON', 'ON', 'CS', 'ON', 'CS', 'ON', 'EN', 'EN', 'EN', 'EN',\r
+  'EN', 'EN', 'EN', 'EN', 'EN', 'EN', 'ON', 'ON', 'ON', 'ON', 'ON', 'ON', 'ON',\r
+  'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L',\r
+  'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'ON', 'ON', 'ON', 'ON',\r
+  'ON', 'ON', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L',\r
+  'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'ON', 'ON',\r
+  'ON', 'ON', 'BN', 'BN', 'BN', 'BN', 'BN', 'BN', 'B', 'BN', 'BN', 'BN', 'BN',\r
+  'BN', 'BN', 'BN', 'BN', 'BN', 'BN', 'BN', 'BN', 'BN', 'BN', 'BN', 'BN', 'BN',\r
+  'BN', 'BN', 'BN', 'BN', 'BN', 'BN', 'BN', 'BN', 'BN', 'CS', 'ON', 'ET', 'ET',\r
+  'ET', 'ET', 'ON', 'ON', 'ON', 'ON', 'L', 'ON', 'ON', 'ON', 'ON', 'ON', 'ET',\r
+  'ET', 'EN', 'EN', 'ON', 'L', 'ON', 'ON', 'ON', 'EN', 'L', 'ON', 'ON', 'ON',\r
+  'ON', 'ON', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L',\r
+  'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'ON', 'L', 'L', 'L', 'L',\r
+  'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L',\r
+  'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'ON', 'L', 'L',\r
+  'L', 'L', 'L', 'L', 'L', 'L'\r
 ];\r
 \r
+// Character types for symbols from 0600 to 06FF\r
 var arabicTypes = [\r
-  "AL", "AL", "AL", "AL", "AL", "AL", "AL", "AL", "AL", "AL", "AL", "AL", "CS",\r
-  "AL", "ON", "ON", //60\r
-  "NSM", "NSM", "NSM", "NSM", "NSM", "NSM", "AL", "AL", "AL", "AL", "AL", "AL",\r
-  "AL", "AL", "AL", "AL", //61\r
-  "AL", "AL", "AL", "AL", "AL", "AL", "AL", "AL", "AL", "AL", "AL", "AL", "AL",\r
-  "AL", "AL", "AL", //62\r
-  "AL", "AL", "AL", "AL", "AL", "AL", "AL", "AL", "AL", "AL", "AL", "AL", "AL",\r
-  "AL", "AL", "AL", //63\r
-  "AL", "AL", "AL", "AL", "AL", "AL", "AL", "AL", "AL", "AL", "AL", "NSM",\r
-  "NSM", "NSM", "NSM", "NSM", //64\r
-  "NSM", "NSM", "NSM", "NSM", "NSM", "NSM", "NSM", "NSM", "NSM", "AL", "AL",\r
-  "AL", "AL", "AL", "AL", "AL", //65\r
-  "AN", "AN", "AN", "AN", "AN", "AN", "AN", "AN", "AN", "AN", "ET", "AN", "AN",\r
-  "AL", "AL", "AL", //66\r
-  "NSM", "AL", "AL", "AL", "AL", "AL", "AL", "AL", "AL", "AL", "AL", "AL", "AL",\r
-  "AL", "AL", "AL", //67\r
-  "AL", "AL", "AL", "AL", "AL", "AL", "AL", "AL", "AL", "AL", "AL", "AL", "AL",\r
-  "AL", "AL", "AL", //68\r
-  "AL", "AL", "AL", "AL", "AL", "AL", "AL", "AL", "AL", "AL", "AL", "AL", "AL",\r
-  "AL", "AL", "AL", //69\r
-  "AL", "AL", "AL", "AL", "AL", "AL", "AL", "AL", "AL", "AL", "AL", "AL", "AL",\r
-  "AL", "AL", "AL", //6a\r
-  "AL", "AL", "AL", "AL", "AL", "AL", "AL", "AL", "AL", "AL", "AL", "AL", "AL",\r
-  "AL", "AL", "AL", //6b\r
-  "AL", "AL", "AL", "AL", "AL", "AL", "AL", "AL", "AL", "AL", "AL", "AL", "AL",\r
-  "AL", "AL", "AL", //6c\r
-  "AL", "AL", "AL", "AL", "AL", "AL", "NSM", "NSM", "NSM", "NSM", "NSM", "NSM",\r
-  "NSM", "NSM", "NSM", "NSM", //6d\r
-  "NSM", "NSM", "NSM", "NSM", "NSM", "NSM", "NSM", "NSM", "NSM", "ON", "NSM",\r
-  "NSM", "NSM", "NSM", "AL", "AL", //6e\r
-  "AL", "AL", "AL", "AL", "AL", "AL", "AL", "AL", "AL", "AL", "AL", "AL", "AL",\r
-  "AL", "AL", "AL"  //6f\r
+  'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'CS',\r
+  'AL', 'ON', 'ON', 'NSM', 'NSM', 'NSM', 'NSM', 'NSM', 'NSM', 'AL', 'AL', 'AL',\r
+  'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL',\r
+  'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL',\r
+  'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL',\r
+  'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'NSM',\r
+  'NSM', 'NSM', 'NSM', 'NSM', 'NSM', 'NSM', 'NSM', 'NSM', 'NSM', 'NSM', 'NSM',\r
+  'NSM', 'NSM', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AN', 'AN', 'AN',\r
+  'AN', 'AN', 'AN', 'AN', 'AN', 'AN', 'AN', 'ET', 'AN', 'AN', 'AL', 'AL', 'AL',\r
+  'NSM', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL',\r
+  'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL',\r
+  'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL',\r
+  'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL',\r
+  'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL',\r
+  'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL',\r
+  'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL',\r
+  'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'NSM',\r
+  'NSM', 'NSM', 'NSM', 'NSM', 'NSM', 'NSM', 'NSM', 'NSM', 'NSM', 'NSM', 'NSM',\r
+  'NSM', 'NSM', 'NSM', 'NSM', 'NSM', 'NSM', 'NSM', 'ON', 'NSM', 'NSM', 'NSM',\r
+  'NSM', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL',\r
+  'AL', 'AL', 'AL', 'AL', 'AL', 'AL'\r
 ];\r
 \r
 function bidi(text, startLevel) {\r
@@ -81,23 +64,23 @@ function bidi(text, startLevel) {
   var numBidi = 0;\r
 \r
   for (var i = 0; i < strLength; ++i) {\r
-    var c = str.charAt(i);\r
-    chars[i] = c;\r
-\r
-    var t = "L";\r
-    if (c <= '\u00ff')\r
-      t = baseTypes[c.charCodeAt(0)];\r
-    else if ('\u0590' <= c && c <= '\u05f4')\r
-      t = "R";\r
-    else if ('\u0600' <= c && c <= '\u06ff')\r
-      t = arabicTypes[c.charCodeAt(0) & 0xff];\r
-    else if ('\u0700' <= c && c <= '\u08AC')\r
-      t = "AL";\r
-\r
-    if (t == "R" || t == "AL" || t == "AN")\r
+    chars[i] = str.charAt(i);\r
+\r
+    var charCode = str.charCodeAt(i);\r
+    var charType = 'L';\r
+    if (charCode <= 0x00ff)\r
+      charType = baseTypes[charCode];\r
+    else if (0x0590 <= charCode && charCode <= 0x05f4)\r
+      charType = 'R';\r
+    else if (0x0600 <= charCode && charCode <= 0x06ff)\r
+      charType = arabicTypes[charCode & 0xff];\r
+    else if (0x0700 <= charCode && charCode <= 0x08AC)\r
+      charType = 'AL';\r
+\r
+    if (charType == 'R' || charType == 'AL' || charType == 'AN')\r
       numBidi++;\r
 \r
-    oldtypes[i] = types[i] = t;\r
+    oldtypes[i] = types[i] = charType;\r
   }\r
 \r
   // detect the bidi method\r
@@ -132,7 +115,7 @@ function bidi(text, startLevel) {
    X1-X10: skip most of this, since we are NOT doing the embeddings.\r
    */\r
 \r
-  var e = isOdd(startLevel) ? "R" : "L";\r
+  var e = isOdd(startLevel) ? 'R' : 'L';\r
   var sor = e;\r
   var eor = sor;\r
 \r
@@ -144,7 +127,7 @@ function bidi(text, startLevel) {
 \r
   var lastType = sor;\r
   for (var i = 0; i < strLength; ++i) {\r
-    if (types[i] == "NSM") types[i] = lastType;\r
+    if (types[i] == 'NSM') types[i] = lastType;\r
     else lastType = types[i];\r
   }\r
 \r
@@ -157,9 +140,9 @@ function bidi(text, startLevel) {
   var lastType = sor;\r
   for (var i = 0; i < strLength; ++i) {\r
     var t = types[i];\r
-    if (t == "EN")\r
-      types[i] = (lastType == "AL") ? "AN" : "EN";\r
-    else if (t == "R" || t == "L" || t == "AL")\r
+    if (t == 'EN')\r
+      types[i] = (lastType == 'AL') ? 'AN' : 'EN';\r
+    else if (t == 'R' || t == 'L' || t == 'AL')\r
       lastType = t;\r
   }\r
 \r
@@ -169,7 +152,7 @@ function bidi(text, startLevel) {
 \r
   for (var i = 0; i < strLength; ++i) {\r
     var t = types[i];\r
-    if (t == "AL") types[i] = "R";\r
+    if (t == 'AL') types[i] = 'R';\r
   }\r
 \r
   /*\r
@@ -179,9 +162,9 @@ function bidi(text, startLevel) {
    */\r
 \r
   for (var i = 1; i < strLength - 1; ++i) {\r
-    if (types[i] == "ES" && types[i - 1] == "EN" && types[i + 1] == "EN")\r
-      types[i] = "EN";\r
-    if (types[i] == "CS" && (types[i - 1] == "EN" || types[i - 1] == "AN") &&\r
+    if (types[i] == 'ES' && types[i - 1] == 'EN' && types[i + 1] == 'EN')\r
+      types[i] = 'EN';\r
+    if (types[i] == 'CS' && (types[i - 1] == 'EN' || types[i - 1] == 'AN') &&\r
         types[i + 1] == types[i - 1])\r
       types[i] = types[i - 1];\r
   }\r
@@ -192,17 +175,17 @@ function bidi(text, startLevel) {
    */\r
 \r
   for (var i = 0; i < strLength; ++i) {\r
-    if (types[i] == "EN") {\r
+    if (types[i] == 'EN') {\r
       // do before\r
-      for (j = i - 1; j >= 0; --j) {\r
-        if (types[j] == "ET")\r
-          types[j] = "EN";\r
+      for (var j = i - 1; j >= 0; --j) {\r
+        if (types[j] == 'ET')\r
+          types[j] = 'EN';\r
         else break;\r
       }\r
       // do after\r
-      for (j = i + 1; j < strLength; --j) {\r
-        if (types[j] == "ET")\r
-          types[j] = "EN";\r
+      for (var j = i + 1; j < strLength; --j) {\r
+        if (types[j] == 'ET')\r
+          types[j] = 'EN';\r
         else break;\r
       }\r
     }\r
@@ -214,8 +197,8 @@ function bidi(text, startLevel) {
 \r
   for (var i = 0; i < strLength; ++i) {\r
     var t = types[i];\r
-    if (t == "WS" || t == "ES" || t == "ET" || t == "CS")\r
-      types[i] = "ON";\r
+    if (t == 'WS' || t == 'ES' || t == 'ET' || t == 'CS')\r
+      types[i] = 'ON';\r
   }\r
 \r
   /*\r
@@ -227,9 +210,9 @@ function bidi(text, startLevel) {
   var lastType = sor;\r
   for (var i = 0; i < strLength; ++i) {\r
     var t = types[i];\r
-    if (t == "EN")\r
-      types[i] = (lastType == "L") ? "L" : "EN";\r
-    else if (t == "R" || t == "L")\r
+    if (t == 'EN')\r
+      types[i] = (lastType == 'L') ? 'L' : 'EN';\r
+    else if (t == 'R' || t == 'L')\r
       lastType = t;\r
   }\r
 \r
@@ -241,18 +224,18 @@ function bidi(text, startLevel) {
    */\r
 \r
   for (var i = 0; i < strLength; ++i) {\r
-    if (types[i] == "ON") {\r
-      var end = findUnequal(types, i + 1, "ON");\r
+    if (types[i] == 'ON') {\r
+      var end = findUnequal(types, i + 1, 'ON');\r
       var before = sor;\r
       if (i > 0)\r
         before = types[i - 1];\r
       var after = eor;\r
       if (end + 1 < strLength)\r
         after = types[end + 1];\r
-      if (before != "L")\r
-        before = "R";\r
-      if (after != "L")\r
-        after = "R";\r
+      if (before != 'L')\r
+        before = 'R';\r
+      if (after != 'L')\r
+        after = 'R';\r
       if (before == after)\r
         setValues(types, i, end, before);\r
       i = end - 1; // reset to end (-1 so next iteration is ok)\r
@@ -264,7 +247,7 @@ function bidi(text, startLevel) {
    */\r
 \r
   for (var i = 0; i < strLength; ++i) {\r
-    if (types[i] == "ON")\r
+    if (types[i] == 'ON')\r
       types[i] = e;\r
   }\r
 \r
@@ -278,15 +261,15 @@ function bidi(text, startLevel) {
   for (var i = 0; i < strLength; ++i) {\r
     var t = types[i];\r
     if (isEven(levels[i])) {\r
-      if (t == "R") {\r
+      if (t == 'R') {\r
         levels[i] += 1;\r
       }\r
-      else if (t == "AN" || t == "EN") {\r
+      else if (t == 'AN' || t == 'EN') {\r
         levels[i] += 2;\r
       }\r
     }\r
     else { // isOdd, so\r
-      if (t == "L" || t == "AN" || t == "EN") {\r
+      if (t == 'L' || t == 'AN' || t == 'EN') {\r
         levels[i] += 1;\r
       }\r
     }\r
@@ -303,7 +286,7 @@ function bidi(text, startLevel) {
    of the line.\r
    */\r
 \r
-  //dont bother as text is only single line\r
+  // don't bother as text is only single line\r
 \r
   /*\r
    L2. From the highest level found in the text to the lowest odd level on each\r
@@ -315,7 +298,7 @@ function bidi(text, startLevel) {
 \r
   var highestLevel = -1;\r
   var lowestOddLevel = 99;\r
-  for (var i = 0; i < levels.length; ++i) {\r
+  for (var i = 0, ii = levels.length; i < ii; ++i) {\r
     var level = levels[i];\r
     if (highestLevel < level)\r
       highestLevel = level;\r
@@ -359,12 +342,12 @@ function bidi(text, startLevel) {
    directionality of that character is R.\r
    */\r
 \r
-  //dont mirror as characters are already mirrored in the pdf\r
+  // don't mirror as characters are already mirrored in the pdf\r
 \r
   // Finally, return string\r
 \r
-  var result = "";\r
-  for (var i = 0; i < chars.length; ++i) {\r
+  var result = '';\r
+  for (var i = 0, ii = chars.length; i < ii; ++i) {\r
     var ch = chars[i];\r
     if (ch != '<' && ch != '>')\r
       result += ch;\r
@@ -372,8 +355,6 @@ function bidi(text, startLevel) {
   return result;\r
 }\r
 \r
-// UTILITIES\r
-\r
 function isOdd(i) {\r
   return (i & 1) != 0;\r
 }\r
@@ -435,10 +416,10 @@ function mirrorGlyphs(c) {
       return '{';\r
     case '{':\r
       return '}';\r
-    case '':\r
-      return '';\r
-    case '':\r
-      return '';\r
+    case '\u00AB':\r
+      return '\u00BB';\r
+    case '\u00BB':\r
+      return '\u00AB';\r
     default:\r
       return c;\r
   }\r