]> git.parisson.com Git - pdf.js.git/commitdiff
Change bidi.js file format to unix
authorBernerd Schaefer <bj.schaefer@gmail.com>
Fri, 16 Mar 2012 10:27:09 +0000 (11:27 +0100)
committer1000Jobboersen Workstation <dev@1000jobboersen.de>
Fri, 16 Mar 2012 10:27:09 +0000 (11:27 +0100)
This gets rid of all the `^M` control characters when viewed with vim.

src/bidi.js

index a6e3e429f0fefcd34a31584a1fc5b15998475a11..b03e66ce41d9070c4e2934bcf49176f898722bbc 100644 (file)
-/* -*- Mode: Java; tab-width: 2; indent-tabs-mode: nil; c-basic-offset: 2 -*- */\r
-/* vim: set shiftwidth=2 tabstop=2 autoindent cindent expandtab: */\r
-\r
-'use strict';\r
-\r
-var bidi = PDFJS.bidi = (function bidiClosure() {\r
-  // Character types for symbols from 0000 to 00FF.\r
-  var baseTypes = [\r
-    'BN', 'BN', 'BN', 'BN', 'BN', 'BN', 'BN', 'BN', 'BN', 'S', 'B', 'S', 'WS',\r
-    'B', 'BN', 'BN', 'BN', 'BN', 'BN', 'BN', 'BN', 'BN', 'BN', 'BN', 'BN', 'BN',\r
-    'BN', 'BN', 'B', 'B', 'B', 'S', 'WS', 'ON', 'ON', 'ET', 'ET', 'ET', 'ON',\r
-    'ON', 'ON', 'ON', 'ON', 'ON', 'CS', 'ON', 'CS', 'ON', 'EN', 'EN', 'EN',\r
-    'EN', 'EN', 'EN', 'EN', 'EN', 'EN', 'EN', 'ON', 'ON', 'ON', 'ON', 'ON',\r
-    'ON', 'ON', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L',\r
-    'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'ON', 'ON',\r
-    'ON', 'ON', 'ON', 'ON', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L',\r
-    'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L',\r
-    'L', 'ON', 'ON', 'ON', 'ON', 'BN', 'BN', 'BN', 'BN', 'BN', 'BN', 'B', 'BN',\r
-    'BN', 'BN', 'BN', 'BN', 'BN', 'BN', 'BN', 'BN', 'BN', 'BN', 'BN', 'BN',\r
-    'BN', 'BN', 'BN', 'BN', 'BN', 'BN', 'BN', 'BN', 'BN', 'BN', 'BN', 'BN',\r
-    'BN', 'CS', 'ON', 'ET', 'ET', 'ET', 'ET', 'ON', 'ON', 'ON', 'ON', 'L', 'ON',\r
-    'ON', 'ON', 'ON', 'ON', 'ET', 'ET', 'EN', 'EN', 'ON', 'L', 'ON', 'ON', 'ON',\r
-    'EN', 'L', 'ON', 'ON', 'ON', 'ON', 'ON', 'L', 'L', 'L', 'L', 'L', 'L', 'L',\r
-    'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L',\r
-    'L', 'ON', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L',\r
-    'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L',\r
-    'L', 'L', 'L', 'ON', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L'\r
-  ];\r
-\r
-  // Character types for symbols from 0600 to 06FF\r
-  var arabicTypes = [\r
-    'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL',\r
-    'CS', 'AL', 'ON', 'ON', 'NSM', 'NSM', 'NSM', 'NSM', 'NSM', 'NSM', 'AL',\r
-    'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL',\r
-    'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL',\r
-    'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL',\r
-    'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL',\r
-    'AL', 'AL', 'AL', 'AL', 'NSM', 'NSM', 'NSM', 'NSM', 'NSM', 'NSM', 'NSM',\r
-    'NSM', 'NSM', 'NSM', 'NSM', 'NSM', 'NSM', 'NSM', 'AL', 'AL', 'AL', 'AL',\r
-    'AL', 'AL', 'AL', 'AN', 'AN', 'AN', 'AN', 'AN', 'AN', 'AN', 'AN', 'AN',\r
-    'AN', 'ET', 'AN', 'AN', 'AL', 'AL', 'AL', 'NSM', 'AL', 'AL', 'AL', 'AL',\r
-    'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL',\r
-    'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL',\r
-    'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL',\r
-    'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL',\r
-    'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL',\r
-    'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL',\r
-    'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL',\r
-    'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL',\r
-    'AL', 'NSM', 'NSM', 'NSM', 'NSM', 'NSM', 'NSM', 'NSM', 'NSM', 'NSM', 'NSM',\r
-    'NSM', 'NSM', 'NSM', 'NSM', 'NSM', 'NSM', 'NSM', 'NSM', 'NSM', 'ON', 'NSM',\r
-    'NSM', 'NSM', 'NSM', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL',\r
-    'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL'\r
-  ];\r
-\r
-  function isOdd(i) {\r
-    return (i & 1) != 0;\r
-  }\r
-\r
-  function isEven(i) {\r
-    return (i & 1) == 0;\r
-  }\r
-\r
-  function findUnequal(arr, start, value) {\r
-    var j;\r
-    for (var j = start, jj = arr.length; j < jj; ++j) {\r
-      if (arr[j] != value)\r
-        return j;\r
-    }\r
-    return j;\r
-  }\r
-\r
-  function setValues(arr, start, end, value) {\r
-    for (var j = start; j < end; ++j) {\r
-      arr[j] = value;\r
-    }\r
-  }\r
-\r
-  function reverseValues(arr, start, end) {\r
-    for (var i = start, j = end - 1; i < j; ++i, --j) {\r
-      var temp = arr[i];\r
-      arr[i] = arr[j];\r
-      arr[j] = temp;\r
-    }\r
-  }\r
-\r
-  function mirrorGlyphs(c) {\r
-    /*\r
-     # BidiMirroring-1.txt\r
-     0028; 0029 # LEFT PARENTHESIS\r
-     0029; 0028 # RIGHT PARENTHESIS\r
-     003C; 003E # LESS-THAN SIGN\r
-     003E; 003C # GREATER-THAN SIGN\r
-     005B; 005D # LEFT SQUARE BRACKET\r
-     005D; 005B # RIGHT SQUARE BRACKET\r
-     007B; 007D # LEFT CURLY BRACKET\r
-     007D; 007B # RIGHT CURLY BRACKET\r
-     00AB; 00BB # LEFT-POINTING DOUBLE ANGLE QUOTATION MARK\r
-     00BB; 00AB # RIGHT-POINTING DOUBLE ANGLE QUOTATION MARK\r
-     */\r
-    switch (c) {\r
-      case '(':\r
-        return ')';\r
-      case ')':\r
-        return '(';\r
-      case '<':\r
-        return '>';\r
-      case '>':\r
-        return '<';\r
-      case ']':\r
-        return '[';\r
-      case '[':\r
-        return ']';\r
-      case '}':\r
-        return '{';\r
-      case '{':\r
-        return '}';\r
-      case '\u00AB':\r
-        return '\u00BB';\r
-      case '\u00BB':\r
-        return '\u00AB';\r
-      default:\r
-        return c;\r
-    }\r
-  }\r
-\r
-  return (function bidi(text, startLevel) {\r
-    var str = text.str;\r
-    var strLength = str.length;\r
-    if (strLength == 0)\r
-      return str;\r
-\r
-    // get types, fill arrays\r
-\r
-    var chars = new Array(strLength);\r
-    var types = new Array(strLength);\r
-    var oldtypes = new Array(strLength);\r
-    var numBidi = 0;\r
-\r
-    for (var i = 0; i < strLength; ++i) {\r
-      chars[i] = str.charAt(i);\r
-\r
-      var charCode = str.charCodeAt(i);\r
-      var charType = 'L';\r
-      if (charCode <= 0x00ff)\r
-        charType = baseTypes[charCode];\r
-      else if (0x0590 <= charCode && charCode <= 0x05f4)\r
-        charType = 'R';\r
-      else if (0x0600 <= charCode && charCode <= 0x06ff)\r
-        charType = arabicTypes[charCode & 0xff];\r
-      else if (0x0700 <= charCode && charCode <= 0x08AC)\r
-        charType = 'AL';\r
-\r
-      if (charType == 'R' || charType == 'AL' || charType == 'AN')\r
-        numBidi++;\r
-\r
-      oldtypes[i] = types[i] = charType;\r
-    }\r
-\r
-    // detect the bidi method\r
-    //  if there are no rtl characters then no bidi needed\r
-    //  if less than 30% chars are rtl then string is primarily ltr\r
-    //  if more than 30% chars are rtl then string is primarily rtl\r
-    if (numBidi == 0) {\r
-      text.direction = 'ltr';\r
-      return str;\r
-    }\r
-\r
-    if (startLevel == -1) {\r
-      if ((strLength / numBidi) < 0.3) {\r
-        text.direction = 'ltr';\r
-        startLevel = 0;\r
-      } else {\r
-        text.direction = 'rtl';\r
-        startLevel = 1;\r
-      }\r
-    }\r
-\r
-    var levels = new Array(strLength);\r
-\r
-    for (var i = 0; i < strLength; ++i) {\r
-      levels[i] = startLevel;\r
-    }\r
-\r
-    var diffChars = new Array(strLength);\r
-    var diffLevels = new Array(strLength);\r
-    var diffTypes = new Array(strLength);\r
-\r
-    /*\r
-     X1-X10: skip most of this, since we are NOT doing the embeddings.\r
-     */\r
-\r
-    var e = isOdd(startLevel) ? 'R' : 'L';\r
-    var sor = e;\r
-    var eor = sor;\r
-\r
-    /*\r
-     W1. Examine each non-spacing mark (NSM) in the level run, and change the\r
-     type of the NSM to the type of the previous character. If the NSM is at the\r
-     start of the level run, it will get the type of sor.\r
-     */\r
-\r
-    var lastType = sor;\r
-    for (var i = 0; i < strLength; ++i) {\r
-      if (types[i] == 'NSM')\r
-        types[i] = lastType;\r
-      else\r
-        lastType = types[i];\r
-    }\r
-\r
-    /*\r
-     W2. Search backwards from each instance of a European number until the\r
-     first strong type (R, L, AL, or sor) is found.  If an AL is found, change\r
-     the type of the European number to Arabic number.\r
-     */\r
-\r
-    var lastType = sor;\r
-    for (var i = 0; i < strLength; ++i) {\r
-      var t = types[i];\r
-      if (t == 'EN')\r
-        types[i] = (lastType == 'AL') ? 'AN' : 'EN';\r
-      else if (t == 'R' || t == 'L' || t == 'AL')\r
-        lastType = t;\r
-    }\r
-\r
-    /*\r
-     W3. Change all ALs to R.\r
-     */\r
-\r
-    for (var i = 0; i < strLength; ++i) {\r
-      var t = types[i];\r
-      if (t == 'AL')\r
-        types[i] = 'R';\r
-    }\r
-\r
-    /*\r
-     W4. A single European separator between two European numbers changes to a\r
-     European number. A single common separator between two numbers of the same\r
-     type changes to that type:\r
-     */\r
-\r
-    for (var i = 1; i < strLength - 1; ++i) {\r
-      if (types[i] == 'ES' && types[i - 1] == 'EN' && types[i + 1] == 'EN')\r
-        types[i] = 'EN';\r
-      if (types[i] == 'CS' && (types[i - 1] == 'EN' || types[i - 1] == 'AN') &&\r
-          types[i + 1] == types[i - 1])\r
-        types[i] = types[i - 1];\r
-    }\r
-\r
-    /*\r
-     W5. A sequence of European terminators adjacent to European numbers changes\r
-     to all European numbers:\r
-     */\r
-\r
-    for (var i = 0; i < strLength; ++i) {\r
-      if (types[i] == 'EN') {\r
-        // do before\r
-        for (var j = i - 1; j >= 0; --j) {\r
-          if (types[j] != 'ET')\r
-            break;\r
-          types[j] = 'EN';\r
-        }\r
-        // do after\r
-        for (var j = i + 1; j < strLength; --j) {\r
-          if (types[j] != 'ET')\r
-            break;\r
-          types[j] = 'EN';\r
-        }\r
-      }\r
-    }\r
-\r
-    /*\r
-     W6. Otherwise, separators and terminators change to Other Neutral:\r
-     */\r
-\r
-    for (var i = 0; i < strLength; ++i) {\r
-      var t = types[i];\r
-      if (t == 'WS' || t == 'ES' || t == 'ET' || t == 'CS')\r
-        types[i] = 'ON';\r
-    }\r
-\r
-    /*\r
-     W7. Search backwards from each instance of a European number until the\r
-     first strong type (R, L, or sor) is found. If an L is found,  then change\r
-     the type of the European number to L.\r
-     */\r
-\r
-    var lastType = sor;\r
-    for (var i = 0; i < strLength; ++i) {\r
-      var t = types[i];\r
-      if (t == 'EN')\r
-        types[i] = (lastType == 'L') ? 'L' : 'EN';\r
-      else if (t == 'R' || t == 'L')\r
-        lastType = t;\r
-    }\r
-\r
-    /*\r
-     N1. A sequence of neutrals takes the direction of the surrounding strong\r
-     text if the text on both sides has the same direction. European and Arabic\r
-     numbers are treated as though they were R. Start-of-level-run (sor) and\r
-     end-of-level-run (eor) are used at level run boundaries.\r
-     */\r
-\r
-    for (var i = 0; i < strLength; ++i) {\r
-      if (types[i] == 'ON') {\r
-        var end = findUnequal(types, i + 1, 'ON');\r
-        var before = sor;\r
-        if (i > 0)\r
-          before = types[i - 1];\r
-        var after = eor;\r
-        if (end + 1 < strLength)\r
-          after = types[end + 1];\r
-        if (before != 'L')\r
-          before = 'R';\r
-        if (after != 'L')\r
-          after = 'R';\r
-        if (before == after)\r
-          setValues(types, i, end, before);\r
-        i = end - 1; // reset to end (-1 so next iteration is ok)\r
-      }\r
-    }\r
-\r
-    /*\r
-     N2. Any remaining neutrals take the embedding direction.\r
-     */\r
-\r
-    for (var i = 0; i < strLength; ++i) {\r
-      if (types[i] == 'ON')\r
-        types[i] = e;\r
-    }\r
-\r
-    /*\r
-     I1. For all characters with an even (left-to-right) embedding direction,\r
-     those of type R go up one level and those of type AN or EN go up two\r
-     levels.\r
-     I2. For all characters with an odd (right-to-left) embedding direction,\r
-     those of type L, EN or AN go up one level.\r
-     */\r
-\r
-    for (var i = 0; i < strLength; ++i) {\r
-      var t = types[i];\r
-      if (isEven(levels[i])) {\r
-        if (t == 'R') {\r
-          levels[i] += 1;\r
-        } else if (t == 'AN' || t == 'EN') {\r
-          levels[i] += 2;\r
-        }\r
-      } else { // isOdd, so\r
-        if (t == 'L' || t == 'AN' || t == 'EN') {\r
-          levels[i] += 1;\r
-        }\r
-      }\r
-    }\r
-\r
-    /*\r
-     L1. On each line, reset the embedding level of the following characters to\r
-     the paragraph embedding level:\r
-\r
-     segment separators,\r
-     paragraph separators,\r
-     any sequence of whitespace characters preceding a segment separator or\r
-     paragraph separator, and any sequence of white space characters at the end\r
-     of the line.\r
-     */\r
-\r
-    // don't bother as text is only single line\r
-\r
-    /*\r
-     L2. From the highest level found in the text to the lowest odd level on\r
-     each line, reverse any contiguous sequence of characters that are at that\r
-     level or higher.\r
-     */\r
-\r
-    // find highest level & lowest odd level\r
-\r
-    var highestLevel = -1;\r
-    var lowestOddLevel = 99;\r
-    for (var i = 0, ii = levels.length; i < ii; ++i) {\r
-      var level = levels[i];\r
-      if (highestLevel < level)\r
-        highestLevel = level;\r
-      if (lowestOddLevel > level && isOdd(level))\r
-        lowestOddLevel = level;\r
-    }\r
-\r
-    // now reverse between those limits\r
-\r
-    for (var level = highestLevel; level >= lowestOddLevel; --level) {\r
-      // find segments to reverse\r
-      var start = -1;\r
-      for (var i = 0, ii = levels.length; i < ii; ++i) {\r
-        if (levels[i] < level) {\r
-          if (start >= 0) {\r
-            reverseValues(chars, start, i);\r
-            start = -1;\r
-          }\r
-        } else if (start < 0) {\r
-          start = i;\r
-        }\r
-      }\r
-      if (start >= 0) {\r
-        reverseValues(chars, start, levels.length);\r
-      }\r
-    }\r
-\r
-    /*\r
-     L3. Combining marks applied to a right-to-left base character will at this\r
-     point precede their base character. If the rendering engine expects them to\r
-     follow the base characters in the final display process, then the ordering\r
-     of the marks and the base character must be reversed.\r
-     */\r
-\r
-    // don't bother for now\r
-\r
-    /*\r
-     L4. A character that possesses the mirrored property as specified by\r
-     Section 4.7, Mirrored, must be depicted by a mirrored glyph if the resolved\r
-     directionality of that character is R.\r
-     */\r
-\r
-    // don't mirror as characters are already mirrored in the pdf\r
-\r
-    // Finally, return string\r
-\r
-    var result = '';\r
-    for (var i = 0, ii = chars.length; i < ii; ++i) {\r
-      var ch = chars[i];\r
-      if (ch != '<' && ch != '>')\r
-        result += ch;\r
-    }\r
-    return result;\r
-  });\r
-})();\r
+/* -*- Mode: Java; tab-width: 2; indent-tabs-mode: nil; c-basic-offset: 2 -*- */
+/* vim: set shiftwidth=2 tabstop=2 autoindent cindent expandtab: */
+
+'use strict';
+
+var bidi = PDFJS.bidi = (function bidiClosure() {
+  // Character types for symbols from 0000 to 00FF.
+  var baseTypes = [
+    'BN', 'BN', 'BN', 'BN', 'BN', 'BN', 'BN', 'BN', 'BN', 'S', 'B', 'S', 'WS',
+    'B', 'BN', 'BN', 'BN', 'BN', 'BN', 'BN', 'BN', 'BN', 'BN', 'BN', 'BN', 'BN',
+    'BN', 'BN', 'B', 'B', 'B', 'S', 'WS', 'ON', 'ON', 'ET', 'ET', 'ET', 'ON',
+    'ON', 'ON', 'ON', 'ON', 'ON', 'CS', 'ON', 'CS', 'ON', 'EN', 'EN', 'EN',
+    'EN', 'EN', 'EN', 'EN', 'EN', 'EN', 'EN', 'ON', 'ON', 'ON', 'ON', 'ON',
+    'ON', 'ON', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L',
+    'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'ON', 'ON',
+    'ON', 'ON', 'ON', 'ON', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L',
+    'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L',
+    'L', 'ON', 'ON', 'ON', 'ON', 'BN', 'BN', 'BN', 'BN', 'BN', 'BN', 'B', 'BN',
+    'BN', 'BN', 'BN', 'BN', 'BN', 'BN', 'BN', 'BN', 'BN', 'BN', 'BN', 'BN',
+    'BN', 'BN', 'BN', 'BN', 'BN', 'BN', 'BN', 'BN', 'BN', 'BN', 'BN', 'BN',
+    'BN', 'CS', 'ON', 'ET', 'ET', 'ET', 'ET', 'ON', 'ON', 'ON', 'ON', 'L', 'ON',
+    'ON', 'ON', 'ON', 'ON', 'ET', 'ET', 'EN', 'EN', 'ON', 'L', 'ON', 'ON', 'ON',
+    'EN', 'L', 'ON', 'ON', 'ON', 'ON', 'ON', 'L', 'L', 'L', 'L', 'L', 'L', 'L',
+    'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L',
+    'L', 'ON', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L',
+    'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L',
+    'L', 'L', 'L', 'ON', 'L', 'L', 'L', 'L', 'L', 'L', 'L', 'L'
+  ];
+
+  // Character types for symbols from 0600 to 06FF
+  var arabicTypes = [
+    'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL',
+    'CS', 'AL', 'ON', 'ON', 'NSM', 'NSM', 'NSM', 'NSM', 'NSM', 'NSM', 'AL',
+    'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL',
+    'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL',
+    'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL',
+    'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL',
+    'AL', 'AL', 'AL', 'AL', 'NSM', 'NSM', 'NSM', 'NSM', 'NSM', 'NSM', 'NSM',
+    'NSM', 'NSM', 'NSM', 'NSM', 'NSM', 'NSM', 'NSM', 'AL', 'AL', 'AL', 'AL',
+    'AL', 'AL', 'AL', 'AN', 'AN', 'AN', 'AN', 'AN', 'AN', 'AN', 'AN', 'AN',
+    'AN', 'ET', 'AN', 'AN', 'AL', 'AL', 'AL', 'NSM', 'AL', 'AL', 'AL', 'AL',
+    'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL',
+    'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL',
+    'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL',
+    'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL',
+    'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL',
+    'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL',
+    'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL',
+    'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL',
+    'AL', 'NSM', 'NSM', 'NSM', 'NSM', 'NSM', 'NSM', 'NSM', 'NSM', 'NSM', 'NSM',
+    'NSM', 'NSM', 'NSM', 'NSM', 'NSM', 'NSM', 'NSM', 'NSM', 'NSM', 'ON', 'NSM',
+    'NSM', 'NSM', 'NSM', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL',
+    'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL', 'AL'
+  ];
+
+  function isOdd(i) {
+    return (i & 1) != 0;
+  }
+
+  function isEven(i) {
+    return (i & 1) == 0;
+  }
+
+  function findUnequal(arr, start, value) {
+    var j;
+    for (var j = start, jj = arr.length; j < jj; ++j) {
+      if (arr[j] != value)
+        return j;
+    }
+    return j;
+  }
+
+  function setValues(arr, start, end, value) {
+    for (var j = start; j < end; ++j) {
+      arr[j] = value;
+    }
+  }
+
+  function reverseValues(arr, start, end) {
+    for (var i = start, j = end - 1; i < j; ++i, --j) {
+      var temp = arr[i];
+      arr[i] = arr[j];
+      arr[j] = temp;
+    }
+  }
+
+  function mirrorGlyphs(c) {
+    /*
+     # BidiMirroring-1.txt
+     0028; 0029 # LEFT PARENTHESIS
+     0029; 0028 # RIGHT PARENTHESIS
+     003C; 003E # LESS-THAN SIGN
+     003E; 003C # GREATER-THAN SIGN
+     005B; 005D # LEFT SQUARE BRACKET
+     005D; 005B # RIGHT SQUARE BRACKET
+     007B; 007D # LEFT CURLY BRACKET
+     007D; 007B # RIGHT CURLY BRACKET
+     00AB; 00BB # LEFT-POINTING DOUBLE ANGLE QUOTATION MARK
+     00BB; 00AB # RIGHT-POINTING DOUBLE ANGLE QUOTATION MARK
+     */
+    switch (c) {
+      case '(':
+        return ')';
+      case ')':
+        return '(';
+      case '<':
+        return '>';
+      case '>':
+        return '<';
+      case ']':
+        return '[';
+      case '[':
+        return ']';
+      case '}':
+        return '{';
+      case '{':
+        return '}';
+      case '\u00AB':
+        return '\u00BB';
+      case '\u00BB':
+        return '\u00AB';
+      default:
+        return c;
+    }
+  }
+
+  return (function bidi(text, startLevel) {
+    var str = text.str;
+    var strLength = str.length;
+    if (strLength == 0)
+      return str;
+
+    // get types, fill arrays
+
+    var chars = new Array(strLength);
+    var types = new Array(strLength);
+    var oldtypes = new Array(strLength);
+    var numBidi = 0;
+
+    for (var i = 0; i < strLength; ++i) {
+      chars[i] = str.charAt(i);
+
+      var charCode = str.charCodeAt(i);
+      var charType = 'L';
+      if (charCode <= 0x00ff)
+        charType = baseTypes[charCode];
+      else if (0x0590 <= charCode && charCode <= 0x05f4)
+        charType = 'R';
+      else if (0x0600 <= charCode && charCode <= 0x06ff)
+        charType = arabicTypes[charCode & 0xff];
+      else if (0x0700 <= charCode && charCode <= 0x08AC)
+        charType = 'AL';
+
+      if (charType == 'R' || charType == 'AL' || charType == 'AN')
+        numBidi++;
+
+      oldtypes[i] = types[i] = charType;
+    }
+
+    // detect the bidi method
+    //  if there are no rtl characters then no bidi needed
+    //  if less than 30% chars are rtl then string is primarily ltr
+    //  if more than 30% chars are rtl then string is primarily rtl
+    if (numBidi == 0) {
+      text.direction = 'ltr';
+      return str;
+    }
+
+    if (startLevel == -1) {
+      if ((strLength / numBidi) < 0.3) {
+        text.direction = 'ltr';
+        startLevel = 0;
+      } else {
+        text.direction = 'rtl';
+        startLevel = 1;
+      }
+    }
+
+    var levels = new Array(strLength);
+
+    for (var i = 0; i < strLength; ++i) {
+      levels[i] = startLevel;
+    }
+
+    var diffChars = new Array(strLength);
+    var diffLevels = new Array(strLength);
+    var diffTypes = new Array(strLength);
+
+    /*
+     X1-X10: skip most of this, since we are NOT doing the embeddings.
+     */
+
+    var e = isOdd(startLevel) ? 'R' : 'L';
+    var sor = e;
+    var eor = sor;
+
+    /*
+     W1. Examine each non-spacing mark (NSM) in the level run, and change the
+     type of the NSM to the type of the previous character. If the NSM is at the
+     start of the level run, it will get the type of sor.
+     */
+
+    var lastType = sor;
+    for (var i = 0; i < strLength; ++i) {
+      if (types[i] == 'NSM')
+        types[i] = lastType;
+      else
+        lastType = types[i];
+    }
+
+    /*
+     W2. Search backwards from each instance of a European number until the
+     first strong type (R, L, AL, or sor) is found.  If an AL is found, change
+     the type of the European number to Arabic number.
+     */
+
+    var lastType = sor;
+    for (var i = 0; i < strLength; ++i) {
+      var t = types[i];
+      if (t == 'EN')
+        types[i] = (lastType == 'AL') ? 'AN' : 'EN';
+      else if (t == 'R' || t == 'L' || t == 'AL')
+        lastType = t;
+    }
+
+    /*
+     W3. Change all ALs to R.
+     */
+
+    for (var i = 0; i < strLength; ++i) {
+      var t = types[i];
+      if (t == 'AL')
+        types[i] = 'R';
+    }
+
+    /*
+     W4. A single European separator between two European numbers changes to a
+     European number. A single common separator between two numbers of the same
+     type changes to that type:
+     */
+
+    for (var i = 1; i < strLength - 1; ++i) {
+      if (types[i] == 'ES' && types[i - 1] == 'EN' && types[i + 1] == 'EN')
+        types[i] = 'EN';
+      if (types[i] == 'CS' && (types[i - 1] == 'EN' || types[i - 1] == 'AN') &&
+          types[i + 1] == types[i - 1])
+        types[i] = types[i - 1];
+    }
+
+    /*
+     W5. A sequence of European terminators adjacent to European numbers changes
+     to all European numbers:
+     */
+
+    for (var i = 0; i < strLength; ++i) {
+      if (types[i] == 'EN') {
+        // do before
+        for (var j = i - 1; j >= 0; --j) {
+          if (types[j] != 'ET')
+            break;
+          types[j] = 'EN';
+        }
+        // do after
+        for (var j = i + 1; j < strLength; --j) {
+          if (types[j] != 'ET')
+            break;
+          types[j] = 'EN';
+        }
+      }
+    }
+
+    /*
+     W6. Otherwise, separators and terminators change to Other Neutral:
+     */
+
+    for (var i = 0; i < strLength; ++i) {
+      var t = types[i];
+      if (t == 'WS' || t == 'ES' || t == 'ET' || t == 'CS')
+        types[i] = 'ON';
+    }
+
+    /*
+     W7. Search backwards from each instance of a European number until the
+     first strong type (R, L, or sor) is found. If an L is found,  then change
+     the type of the European number to L.
+     */
+
+    var lastType = sor;
+    for (var i = 0; i < strLength; ++i) {
+      var t = types[i];
+      if (t == 'EN')
+        types[i] = (lastType == 'L') ? 'L' : 'EN';
+      else if (t == 'R' || t == 'L')
+        lastType = t;
+    }
+
+    /*
+     N1. A sequence of neutrals takes the direction of the surrounding strong
+     text if the text on both sides has the same direction. European and Arabic
+     numbers are treated as though they were R. Start-of-level-run (sor) and
+     end-of-level-run (eor) are used at level run boundaries.
+     */
+
+    for (var i = 0; i < strLength; ++i) {
+      if (types[i] == 'ON') {
+        var end = findUnequal(types, i + 1, 'ON');
+        var before = sor;
+        if (i > 0)
+          before = types[i - 1];
+        var after = eor;
+        if (end + 1 < strLength)
+          after = types[end + 1];
+        if (before != 'L')
+          before = 'R';
+        if (after != 'L')
+          after = 'R';
+        if (before == after)
+          setValues(types, i, end, before);
+        i = end - 1; // reset to end (-1 so next iteration is ok)
+      }
+    }
+
+    /*
+     N2. Any remaining neutrals take the embedding direction.
+     */
+
+    for (var i = 0; i < strLength; ++i) {
+      if (types[i] == 'ON')
+        types[i] = e;
+    }
+
+    /*
+     I1. For all characters with an even (left-to-right) embedding direction,
+     those of type R go up one level and those of type AN or EN go up two
+     levels.
+     I2. For all characters with an odd (right-to-left) embedding direction,
+     those of type L, EN or AN go up one level.
+     */
+
+    for (var i = 0; i < strLength; ++i) {
+      var t = types[i];
+      if (isEven(levels[i])) {
+        if (t == 'R') {
+          levels[i] += 1;
+        } else if (t == 'AN' || t == 'EN') {
+          levels[i] += 2;
+        }
+      } else { // isOdd, so
+        if (t == 'L' || t == 'AN' || t == 'EN') {
+          levels[i] += 1;
+        }
+      }
+    }
+
+    /*
+     L1. On each line, reset the embedding level of the following characters to
+     the paragraph embedding level:
+
+     segment separators,
+     paragraph separators,
+     any sequence of whitespace characters preceding a segment separator or
+     paragraph separator, and any sequence of white space characters at the end
+     of the line.
+     */
+
+    // don't bother as text is only single line
+
+    /*
+     L2. From the highest level found in the text to the lowest odd level on
+     each line, reverse any contiguous sequence of characters that are at that
+     level or higher.
+     */
+
+    // find highest level & lowest odd level
+
+    var highestLevel = -1;
+    var lowestOddLevel = 99;
+    for (var i = 0, ii = levels.length; i < ii; ++i) {
+      var level = levels[i];
+      if (highestLevel < level)
+        highestLevel = level;
+      if (lowestOddLevel > level && isOdd(level))
+        lowestOddLevel = level;
+    }
+
+    // now reverse between those limits
+
+    for (var level = highestLevel; level >= lowestOddLevel; --level) {
+      // find segments to reverse
+      var start = -1;
+      for (var i = 0, ii = levels.length; i < ii; ++i) {
+        if (levels[i] < level) {
+          if (start >= 0) {
+            reverseValues(chars, start, i);
+            start = -1;
+          }
+        } else if (start < 0) {
+          start = i;
+        }
+      }
+      if (start >= 0) {
+        reverseValues(chars, start, levels.length);
+      }
+    }
+
+    /*
+     L3. Combining marks applied to a right-to-left base character will at this
+     point precede their base character. If the rendering engine expects them to
+     follow the base characters in the final display process, then the ordering
+     of the marks and the base character must be reversed.
+     */
+
+    // don't bother for now
+
+    /*
+     L4. A character that possesses the mirrored property as specified by
+     Section 4.7, Mirrored, must be depicted by a mirrored glyph if the resolved
+     directionality of that character is R.
+     */
+
+    // don't mirror as characters are already mirrored in the pdf
+
+    // Finally, return string
+
+    var result = '';
+    for (var i = 0, ii = chars.length; i < ii; ++i) {
+      var ch = chars[i];
+      if (ch != '<' && ch != '>')
+        result += ch;
+    }
+    return result;
+  });
+})();