ECMAScript | Атом (Atom) | Регулярные выражения (Regular Expression)

С параметром направления direction.

Производство Atom :: PatternCharacter оценивается следующим образом:

1. Пусть ch будет символом, совпадающим с PatternCharacter.
2. Пусть A будет одно-элементным CharSet, содержащим символ ch.
3. Вернуть ! CharacterSetMatcher(A, false, direction).

Производство Atom :: . оценивается следующим образом:

1. Пусть A будет CharSet всех символов.
2. Если DotAll не является true, тогда
   а. Удалите из A все символы, соответствующие кодовой точке в правой части производства LineTerminator.
3. Вернуть ! CharacterSetMatcher(A, false, direction).

Производство Atom :: \ AtomEscape оценивается следующим образом:

1. Вернуть Сопоставитель Matcher, который является результатом вычисления AtomEscape с аргументом direction.

Производство Atom :: CharacterClass оценивается следующим образом:

1. Оцените CharacterClass, чтобы получить CharSet A и логическое инвертирование invert.
2. Вернуть ! CharacterSetMatcher(A, invert, direction).

Производство Atom :: ( GroupSpecifier Disjunction ) оценивается следующим образом:

1. Оцените Дизъюнкцию (Disjunction) с аргументом direction, чтобы получить Сопоставитель Matcher m.
2. Пусть parenIndex будет числом скобок с левым захватом во всем регулярном выражении, которое встречается слева от этого Атома Atom. Это общее количество узлов синтаксического анализа Атома Atom :: ( GroupSpecifier Disjunction ), предшествующих или включающих этот Атом Atom.
3. Верните новый Сопоставитель Matcher с параметрами (x, c), который фиксирует направление direction, m и parenIndex и при вызове выполняет следующие шаги:
а. Утверждено: x - это Состояние (State).
b. Утверждено: c - это Продолжение (Continuation).
c. Пусть d будет новым Продолжением с параметрами (y), которое захватывает x, c, direction и parenIndex и при вызове выполняет следующие шаги:
i. Утверждено: y - это Состояние (State).
ii. Пусть cap будет копией Списка y из captures.
iii. Пусть xe будет endIndex для x.
iv. Пусть ye будет endIndex из у.
v. Если direction = 1, тогда
1. Утверждено: xe ≤ ye.
2. Пусть s будет Списком, элементы которого являются символами Input с индексами от xe (включительно) до ye (исключая).
vi. Иначе,
1. Утверждено: направление direction равен -1.
2. Утверждено: ye ≤ xe.
3. Пусть s будет Списком, элементы которого являются символами Input с индексами от ye (включительно) до xe (исключая).
vii. Установите cap[parenIndex + 1] в s.
viii. Пусть z будет Состоянием (ye, cap).
ix. Верните c(z).
d. Верните m(x, d).

Производство Atom :: ( ? : Disjunction ) оценивается следующим образом:

1. Верните Сопоставитель Matcher, который является результатом оценки Дизъюнкции Disjunction с аргументом direction.

22.2.2.8.1 CharacterSetMatcher ( A, invert, direction )
22.2.2.8.2 Canonicalize ( ch )
22.2.2.8.3 UnicodeMatchProperty ( p )
22.2.2.8.4 UnicodeMatchPropertyValue ( p, v )

CharacterSetMatcher ( A, invert, direction )

Абстрактная операция CharacterSetMatcher (Сопоставитель набора символов) принимает аргументы A (CharSet), invert (логическое значение) и направление direction (1 или -1). При вызове он выполняет следующие шаги:

1. Вернуть новый Сопоставитель Matcher с параметрами (x, c), который фиксирует A, invert и direction и при вызове выполняет следующие шаги:
   а. Утверждено: x - это Состояние (State).
   b. Утверждено: c - это Продолжение (Continuation).
   c. Пусть e будет endIndex для x.
   d. Пусть f - это e + direction.
   е. Если f < 0 или f > InputLength, вернуть ошибку failure.
   f. Пусть index равен min(e, f).
   g. Пусть ch будет символом Input[index].
   h. Пусть cc будет Canonicalize(ch).
   i. Если существует такой член a класса A, что Canonicalize(a) имеет значение cc, пусть найденное found будет true (истина). В противном случае пусть найденный found будет false (ложным).
   j. Если invert является false (ложно), а found - false, вернуть ошибку failure.
   k. Если invert является true, а found - true, вернуть ошибку failure.
   l. Пусть cap будет списком захвата captures для x.
   m. Пусть y будет состоянием (f, cap).
   n. Вернуть c(y).

Canonicalize ( ch )

Абстрактная операция Canonicalize (Канонизация) принимает аргумент ch (символ). При вызове она выполняет следующие шаги:

1. Если Unicode является true и IgnoreCase является true, тогда
   а. Если файл CaseFolding.txt базы данных символов Unicode предоставляет простое или обычное отображение сворачивания регистра для ch, верните результат применения этого отображения к ch.
   b. Вернуть ch.
2. Если IgnoreCase является false, вернуть ch.
3. Утверждено: ch - это кодовая единица UTF-16.
4. Пусть cp будет кодовой точкой, числовое значение которой совпадает с ch.
5. Пусть u будет результатом toUppercase («cp») в соответствии с алгоритмом преобразования регистра Unicode по умолчанию.
6. Пусть uStr будет ! CodePointsToString(u).
7. Если uStr не состоит из единственной кодовой единицы, вернуть ch.
8. Пусть cu будет единичным элементом кода uStr.
9. Если числовое значение ch ≥ 128 и числовое значение cu <128, вернуть ch.
10. Вернуть cu.

Примечание 1

Скобки формы ( Disjunction ) служат как для группировки компонентов шаблона Дизъюнкции Disjunction, так и для сохранения результата сопоставления. Результат может быть использован либо в обратной ссылке (\, за которой следует ненулевое десятичное число), на него можно ссылаться в строке замены, либо он может быть возвращен как часть массива из регулярного выражения, соответствующего Abstract Closure. Чтобы запретить захват скобок, используйте вместо этого форму ( ? : Disjunction ).

Примечание 2

Форма (?= Disjunction ) определяет положительный просмотр вперед нулевой ширины. Для успеха Шаблон внутри Disjunction должен совпадать в текущей позиции, но текущая позиция не продвигается вперед до совпадения с Продолжением. Если Дизъюнкция Disjunction может соответствовать в текущей позиции несколькими способами, пробуется только первый из них. В отличие от других операторов регулярных выражений, здесь нет возврата к форме (?= (Это необычное поведение унаследовано от Perl). Это имеет значение только тогда, когда Дизъюнкция Disjunction содержит захватывающие скобки, а продолжение шаблона содержит обратные ссылки на эти захваты.

Например

/(?=(a+))/.exec("baaabac")

совпадает с пустой строкой сразу после первого «b» и, следовательно, возвращает массив:

["", "aaa"]

Чтобы проиллюстрировать отсутствие возврата к просмотру вперед, рассмотрим:

/(?=(a+))a*b\1/.exec("baaabac")

Это выражение возвращает

["aba", "a"]

и не

["aaaba", "a"]

Примечание 3

Форма (?! Disjunction ) определяет отрицательный просмотр вперед нулевой ширины. Для успешного выполнения шаблон внутри Дизъюнкции Disjunction не должен совпадать с текущей позицией. Текущая позиция не продвигается вперед до совпадения с Продолжением. Дизъюнкция Disjunction может содержать захватывающие скобки, но обратные ссылки на них имеют смысл только внутри самой Дизъюнкции Disjunction. Обратные ссылки на эти захватывающие круглые скобки из других мест в шаблоне всегда возвращают значение undefined, потому что отрицательный просмотр вперед должен завершиться ошибкой для успешного выполнения шаблона. Например,

/(.*?)a(?!(a+)b\2c)\2(.*)/.exec("baaabaac")

ищет «a«, за которым сразу не следует некоторое положительное число n из «a«, «b«, еще n «a» (заданное первым \2) и «c«. Второй \2 находится за пределами отрицательного просмотра вперед, поэтому он сопоставляется с undefined и, следовательно, всегда успешен. Все выражение возвращает массив:

["baaabaac", "ba", undefined, "abaac"]

Примечание 4

В совпадениях без учета регистра, когда Unicode имеет значение true, все символы неявно свертываются по регистру с использованием простого сопоставления, обеспечиваемого стандартом Unicode, непосредственно перед их сравнением. Простое отображение всегда отображается в одну кодовую точку, поэтому оно не отображает, например, ß (U+00DF) в SS. Однако он может отображать кодовую точку вне диапазона Basic Latin в символ внутри, например, ſ (U+017F) в s. Такие символы не отображаются, если Unicode имеет значение false. Это предотвращает совпадение кодовых точек Unicode, таких как U+017F и U+212A, с регулярными выражениями, такими как /[a-z]/i, но они будут соответствовать /[a-z]/ui.

UnicodeMatchProperty ( p )

Абстрактная операция UnicodeMatchProperty (Свойство соответствия Unicode) принимает аргумент p (список кодовых точек Unicode). При вызове онf выполняет следующие шаги:

1. Утверждено: p - это Список кодовых точек Unicode, который идентичен Списку кодовых точек Unicode, который является именем свойства Unicode или псевдонимом свойства, перечисленным в столбце «Имя свойства и псевдонимы» (Property name and aliases) Таблицы 60 или Таблицы 61.
2. Пусть c будет каноническим именем свойства p, указанным в столбце «Каноническое имя свойства» (Canonical property name) соответствующей строки.
3. Верните Список кодовых точек Unicode c.

Реализации должны поддерживать имена и псевдонимы свойств Unicode, перечисленные в Таблице 60 и Таблице 61. Для обеспечения взаимодействия реализации не должны поддерживать какие-либо другие имена или псевдонимы свойств.

Примечание 1

Например, Script_Extensions (имя свойства) и scx (псевдоним свойства) допустимы, а script_extensions или Scx — нет.

Примечание 2

Перечисленные свойства являются расширенным набором того, что требуется для UTS18 RL1.2.

Название и псевдонимы свойства	Каноническое имя свойства
General_Category	`General_Category`
gc
Script	`Script`
sc
Script_Extensions	`Script_Extensions`
scx

Таблица 60: Псевдонимы небинарных свойств Unicode и их канонические имена свойств

Таблица 61: Псевдонимы свойств двоичного Unicode и их канонические имена свойств

Property name and aliases	Canonical property name
`ASCII`	`ASCII`
`ASCII_Hex_Digit`	`ASCII_Hex_Digit`
`AHex`	`ASCII_Hex_Digit`
`Alphabetic`	`Alphabetic`
`Alpha`	`Alphabetic`
`Any`	`Any`
`Assigned`	`Assigned`
`Bidi_Control`	`Bidi_Control`
`Bidi_C`	`Bidi_Control`
`Bidi_Mirrored`	`Bidi_Mirrored`
`Bidi_M`	`Bidi_Mirrored`
`Case_Ignorable`	`Case_Ignorable`
`CI`	`Case_Ignorable`
`Cased`	`Cased`
`Changes_When_Casefolded`	`Changes_When_Casefolded`
`CWCF`	`Changes_When_Casefolded`
`Changes_When_Casemapped`	`Changes_When_Casemapped`
`CWCM`	`Changes_When_Casemapped`
`Changes_When_Lowercased`	`Changes_When_Lowercased`
`CWL`	`Changes_When_Lowercased`
`Changes_When_NFKC_Casefolded`	`Changes_When_NFKC_Casefolded`
`CWKCF`	`Changes_When_NFKC_Casefolded`
`Changes_When_Titlecased`	`Changes_When_Titlecased`
`CWT`	`Changes_When_Titlecased`
`Changes_When_Uppercased`	`Changes_When_Uppercased`
`CWU`	`Changes_When_Uppercased`
`Dash`	`Dash`
`Default_Ignorable_Code_Point`	`Default_Ignorable_Code_Point`
`DI`	`Default_Ignorable_Code_Point`
`Deprecated`	`Deprecated`
`Dep`	`Deprecated`
`Diacritic`	`Diacritic`
`Dia`	`Diacritic`
`Emoji`	`Emoji`
`Emoji_Component`	`Emoji_Component`
`EComp`	`Emoji_Component`
`Emoji_Modifier`	`Emoji_Modifier`
`EMod`	`Emoji_Modifier`
`Emoji_Modifier_Base`	`Emoji_Modifier_Base`
`EBase`	`Emoji_Modifier_Base`
`Emoji_Presentation`	`Emoji_Presentation`
`EPres`	`Emoji_Presentation`
`Extended_Pictographic`	`Extended_Pictographic`
`ExtPict`	`Extended_Pictographic`
`Extender`	`Extender`
`Ext`	`Extender`
`Grapheme_Base`	`Grapheme_Base`
`Gr_Base`	`Grapheme_Base`
`Grapheme_Extend`	`Grapheme_Extend`
`Gr_Ext`	`Grapheme_Extend`
`Hex_Digit`	`Hex_Digit`
`Hex`	`Hex_Digit`
`IDS_Binary_Operator`	`IDS_Binary_Operator`
`IDSB`	`IDS_Binary_Operator`
`IDS_Trinary_Operator`	`IDS_Trinary_Operator`
`IDST`	`IDS_Trinary_Operator`
`ID_Continue`	`ID_Continue`
`IDC`	`ID_Continue`
`ID_Start`	`ID_Start`
`IDS`	`ID_Start`
`Ideographic`	`Ideographic`
`Ideo`	`Ideographic`
`Join_Control`	`Join_Control`
`Join_C`	`Join_Control`
`Logical_Order_Exception`	`Logical_Order_Exception`
`LOE`	`Logical_Order_Exception`
`Lowercase`	`Lowercase`
`Lower`	`Lowercase`
`Math`	`Math`
`Noncharacter_Code_Point`	`Noncharacter_Code_Point`
`NChar`	`Noncharacter_Code_Point`
`Pattern_Syntax`	`Pattern_Syntax`
`Pat_Syn`	`Pattern_Syntax`
`Pattern_White_Space`	`Pattern_White_Space`
`Pat_WS`	`Pattern_White_Space`
`Quotation_Mark`	`Quotation_Mark`
`QMark`	`Quotation_Mark`
`Radical`	`Radical`
`Regional_Indicator`	`Regional_Indicator`
`RI`	`Regional_Indicator`
`Sentence_Terminal`	`Sentence_Terminal`
`STerm`	`Sentence_Terminal`
`Soft_Dotted`	`Soft_Dotted`
`SD`	`Soft_Dotted`
`Terminal_Punctuation`	`Terminal_Punctuation`
`Term`	`Terminal_Punctuation`
`Unified_Ideograph`	`Unified_Ideograph`
`UIdeo`	`Unified_Ideograph`
`Uppercase`	`Uppercase`
`Upper`	`Uppercase`
`Variation_Selector`	`Variation_Selector`
`VS`	`Variation_Selector`
`White_Space`	`White_Space`
`space`	`White_Space`
`XID_Continue`	`XID_Continue`
`XIDC`	`XID_Continue`
`XID_Start`	`XID_Start`
`XIDS`	`XID_Start`

UnicodeMatchPropertyValue ( p, v )

Абстрактная операция UnicodeMatchPropertyValue (Значение свойства соответствия Unicode) принимает аргументы p (список кодовых точек Unicode) и v (список кодовых точек Unicode). При вызове она выполняет следующие шаги:

1. Утверждено: p - это Список кодовых точек Unicode, который идентичен Списку кодовых точек Unicode, который представляет собой каноническое имя свойства Unicode без псевдонима, указанное в столбце «Каноническое имя свойства» таблицы 60.
2. Утверждено: v - это Список кодовых точек Unicode, который идентичен Списку кодовых точек Unicode, который является значением свойства или псевдонимом значения свойства для свойства Unicode p, указанного в столбце «Значение свойства и псевдонимы» Таблицы 62 или Таблицы 63.
3. Пусть value будет каноническим значением свойства v, указанным в столбце «Значение канонического свойства» соответствующей строки.
4. Верните Список кодовых точек Unicode из value.

Реализации должны поддерживать имена и псевдонимы значений свойств Unicode, перечисленные в Таблице 62 и Таблице 63. Для обеспечения взаимодействия реализации не должны поддерживать какие-либо другие имена или псевдонимы значений свойств.

Примечание 1

Например, Xpeo и Old_Persian являются допустимыми значениями Script_Extensions, а xpeo и Old Persian — нет.

Примечание 2

Этот алгоритм отличается от правил сопоставления для символьных значений, перечисленных в UAX44: регистр, пробел, U+002D (ДЕФИС-МИНУС) и U+005F (НИЗКАЯ СТРОКА) не игнорируются, а префикс Is не поддерживается.

Таблица 62: Псевдонимы значений и канонические значения для свойства General_Category

Property value and aliases	Canonical property value
`Cased_Letter`	`Cased_Letter`
`LC`	`Cased_Letter`
`Close_Punctuation`	`Close_Punctuation`
`Pe`	`Close_Punctuation`
`Connector_Punctuation`	`Connector_Punctuation`
`Pc`	`Connector_Punctuation`
`Control`	`Control`
`Cc`
`cntrl`
`Currency_Symbol`	`Currency_Symbol`
`Sc`	`Currency_Symbol`
`Dash_Punctuation`	`Dash_Punctuation`
`Pd`	`Dash_Punctuation`
`Decimal_Number`	`Decimal_Number`
`Nd`
`digit`
`Enclosing_Mark`	`Enclosing_Mark`
`Me`	`Enclosing_Mark`
`Final_Punctuation`	`Final_Punctuation`
`Pf`	`Final_Punctuation`
`Format`	`Format`
`Cf`	`Format`
`Initial_Punctuation`	`Initial_Punctuation`
`Pi`	`Initial_Punctuation`
`Letter`	`Letter`
`L`	`Letter`
`Letter_Number`	`Letter_Number`
`Nl`	`Letter_Number`
`Line_Separator`	`Line_Separator`
`Zl`	`Line_Separator`
`Lowercase_Letter`	`Lowercase_Letter`
`Ll`	`Lowercase_Letter`
`Mark`	`Mark`
`M`
`Combining_Mark`
`Math_Symbol`	`Math_Symbol`
`Sm`	`Math_Symbol`
`Modifier_Letter`	`Modifier_Letter`
`Lm`	`Modifier_Letter`
`Modifier_Symbol`	`Modifier_Symbol`
`Sk`	`Modifier_Symbol`
`Nonspacing_Mark`	`Nonspacing_Mark`
`Mn`	`Nonspacing_Mark`
`Number`	`Number`
`N`	`Number`
`Open_Punctuation`	`Open_Punctuation`
`Ps`	`Open_Punctuation`
`Other`	`Other`
`C`	`Other`
`Other_Letter`	`Other_Letter`
`Lo`	`Other_Letter`
`Other_Number`	`Other_Number`
`No`	`Other_Number`
`Other_Punctuation`	`Other_Punctuation`
`Po`	`Other_Punctuation`
`Other_Symbol`	`Other_Symbol`
`So`	`Other_Symbol`
`Paragraph_Separator`	`Paragraph_Separator`
`Zp`	`Paragraph_Separator`
`Private_Use`	`Private_Use`
`Co`	`Private_Use`
`Punctuation`	`Punctuation`
`P`
`punct`
`Separator`	`Separator`
`Z`	`Separator`
`Space_Separator`	`Space_Separator`
`Zs`	`Space_Separator`
`Spacing_Mark`	`Spacing_Mark`
`Mc`	`Spacing_Mark`
`Surrogate`	`Surrogate`
`Cs`	`Surrogate`
`Symbol`	`Symbol`
`S`	`Symbol`
`Titlecase_Letter`	`Titlecase_Letter`
`Lt`	`Titlecase_Letter`
`Unassigned`	`Unassigned`
`Cn`	`Unassigned`
`Uppercase_Letter`	`Uppercase_Letter`
`Lu`	`Uppercase_Letter`

Таблица 63: Псевдонимы значений и канонические значения для свойств Unicode Script и Script_Extensions

Property value and aliases	Canonical property value
`Adlam`	`Adlam`
`Adlm`	`Adlam`
`Ahom`	`Ahom`
`Anatolian_Hieroglyphs`	`Anatolian_Hieroglyphs`
`Hluw`	`Anatolian_Hieroglyphs`
`Arabic`	`Arabic`
`Arab`	`Arabic`
`Armenian`	`Armenian`
`Armn`	`Armenian`
`Avestan`	`Avestan`
`Avst`	`Avestan`
`Balinese`	`Balinese`
`Bali`	`Balinese`
`Bamum`	`Bamum`
`Bamu`	`Bamum`
`Bassa_Vah`	`Bassa_Vah`
`Bass`	`Bassa_Vah`
`Batak`	`Batak`
`Batk`	`Batak`
`Bengali`	`Bengali`
`Beng`	`Bengali`
`Bhaiksuki`	`Bhaiksuki`
`Bhks`	`Bhaiksuki`
`Bopomofo`	`Bopomofo`
`Bopo`	`Bopomofo`
`Brahmi`	`Brahmi`
`Brah`	`Brahmi`
`Braille`	`Braille`
`Brai`	`Braille`
`Buginese`	`Buginese`
`Bugi`	`Buginese`
`Buhid`	`Buhid`
`Buhd`	`Buhid`
`Canadian_Aboriginal`	`Canadian_Aboriginal`
`Cans`	`Canadian_Aboriginal`
`Carian`	`Carian`
`Cari`	`Carian`
`Caucasian_Albanian`	`Caucasian_Albanian`
`Aghb`	`Caucasian_Albanian`
`Chakma`	`Chakma`
`Cakm`	`Chakma`
`Cham`	`Cham`
`Chorasmian`	`Chorasmian`
`Chrs`	`Chorasmian`
`Cherokee`	`Cherokee`
`Cher`	`Cherokee`
`Common`	`Common`
`Zyyy`	`Common`
`Coptic`	`Coptic`
`Copt`
`Qaac`
`Cuneiform`	`Cuneiform`
`Xsux`	`Cuneiform`
`Cypriot`	`Cypriot`
`Cprt`	`Cypriot`
`Cyrillic`	`Cyrillic`
`Cyrl`	`Cyrillic`
`Deseret`	`Deseret`
`Dsrt`	`Deseret`
`Devanagari`	`Devanagari`
`Deva`	`Devanagari`
`Dives_Akuru`	`Dives_Akuru`
`Diak`	`Dives_Akuru`
`Dogra`	`Dogra`
`Dogr`	`Dogra`
`Duployan`	`Duployan`
`Dupl`	`Duployan`
`Egyptian_Hieroglyphs`	`Egyptian_Hieroglyphs`
`Egyp`	`Egyptian_Hieroglyphs`
`Elbasan`	`Elbasan`
`Elba`	`Elbasan`
`Elymaic`	`Elymaic`
`Elym`	`Elymaic`
`Ethiopic`	`Ethiopic`
`Ethi`	`Ethiopic`
`Georgian`	`Georgian`
`Geor`	`Georgian`
`Glagolitic`	`Glagolitic`
`Glag`	`Glagolitic`
`Gothic`	`Gothic`
`Goth`	`Gothic`
`Grantha`	`Grantha`
`Gran`	`Grantha`
`Greek`	`Greek`
`Grek`	`Greek`
`Gujarati`	`Gujarati`
`Gujr`	`Gujarati`
`Gunjala_Gondi`	`Gunjala_Gondi`
`Gong`	`Gunjala_Gondi`
`Gurmukhi`	`Gurmukhi`
`Guru`	`Gurmukhi`
`Han`	`Han`
`Hani`	`Han`
`Hangul`	`Hangul`
`Hang`	`Hangul`
`Hanifi_Rohingya`	`Hanifi_Rohingya`
`Rohg`	`Hanifi_Rohingya`
`Hanunoo`	`Hanunoo`
`Hano`	`Hanunoo`
`Hatran`	`Hatran`
`Hatr`	`Hatran`
`Hebrew`	`Hebrew`
`Hebr`	`Hebrew`
`Hiragana`	`Hiragana`
`Hira`	`Hiragana`
`Imperial_Aramaic`	`Imperial_Aramaic`
`Armi`	`Imperial_Aramaic`
`Inherited`	`Inherited`
`Zinh`
`Qaai`
`Inscriptional_Pahlavi`	`Inscriptional_Pahlavi`
`Phli`	`Inscriptional_Pahlavi`
`Inscriptional_Parthian`	`Inscriptional_Parthian`
`Prti`	`Inscriptional_Parthian`
`Javanese`	`Javanese`
`Java`	`Javanese`
`Kaithi`	`Kaithi`
`Kthi`	`Kaithi`
`Kannada`	`Kannada`
`Knda`	`Kannada`
`Katakana`	`Katakana`
`Kana`	`Katakana`
`Kayah_Li`	`Kayah_Li`
`Kali`	`Kayah_Li`
`Kharoshthi`	`Kharoshthi`
`Khar`	`Kharoshthi`
`Khitan_Small_Script`	`Khitan_Small_Script`
`Kits`	`Khitan_Small_Script`
`Khmer`	`Khmer`
`Khmr`	`Khmer`
`Khojki`	`Khojki`
`Khoj`	`Khojki`
`Khudawadi`	`Khudawadi`
`Sind`	`Khudawadi`
`Lao`	`Lao`
`Laoo`	`Lao`
`Latin`	`Latin`
`Latn`	`Latin`
`Lepcha`	`Lepcha`
`Lepc`	`Lepcha`
`Limbu`	`Limbu`
`Limb`	`Limbu`
`Linear_A`	`Linear_A`
`Lina`	`Linear_A`
`Linear_B`	`Linear_B`
`Linb`	`Linear_B`
`Lisu`	`Lisu`
`Lycian`	`Lycian`
`Lyci`	`Lycian`
`Lydian`	`Lydian`
`Lydi`	`Lydian`
`Mahajani`	`Mahajani`
`Mahj`	`Mahajani`
`Makasar`	`Makasar`
`Maka`	`Makasar`
`Malayalam`	`Malayalam`
`Mlym`	`Malayalam`
`Mandaic`	`Mandaic`
`Mand`	`Mandaic`
`Manichaean`	`Manichaean`
`Mani`	`Manichaean`
`Marchen`	`Marchen`
`Marc`	`Marchen`
`Medefaidrin`	`Medefaidrin`
`Medf`	`Medefaidrin`
`Masaram_Gondi`	`Masaram_Gondi`
`Gonm`	`Masaram_Gondi`
`Meetei_Mayek`	`Meetei_Mayek`
`Mtei`	`Meetei_Mayek`
`Mende_Kikakui`	`Mende_Kikakui`
`Mend`	`Mende_Kikakui`
`Meroitic_Cursive`	`Meroitic_Cursive`
`Merc`	`Meroitic_Cursive`
`Meroitic_Hieroglyphs`	`Meroitic_Hieroglyphs`
`Mero`	`Meroitic_Hieroglyphs`
`Miao`	`Miao`
`Plrd`	`Miao`
`Modi`	`Modi`
`Mongolian`	`Mongolian`
`Mong`	`Mongolian`
`Mro`	`Mro`
`Mroo`	`Mro`
`Multani`	`Multani`
`Mult`	`Multani`
`Myanmar`	`Myanmar`
`Mymr`	`Myanmar`
`Nabataean`	`Nabataean`
`Nbat`	`Nabataean`
`Nandinagari`	`Nandinagari`
`Nand`	`Nandinagari`
`New_Tai_Lue`	`New_Tai_Lue`
`Talu`	`New_Tai_Lue`
`Newa`	`Newa`
`Nko`	`Nko`
`Nkoo`	`Nko`
`Nushu`	`Nushu`
`Nshu`	`Nushu`
`Nyiakeng_Puachue_Hmong`	`Nyiakeng_Puachue_Hmong`
`Hmnp`	`Nyiakeng_Puachue_Hmong`
`Ogham`	`Ogham`
`Ogam`	`Ogham`
`Ol_Chiki`	`Ol_Chiki`
`Olck`	`Ol_Chiki`
`Old_Hungarian`	`Old_Hungarian`
`Hung`	`Old_Hungarian`
`Old_Italic`	`Old_Italic`
`Ital`	`Old_Italic`
`Old_North_Arabian`	`Old_North_Arabian`
`Narb`	`Old_North_Arabian`
`Old_Permic`	`Old_Permic`
`Perm`	`Old_Permic`
`Old_Persian`	`Old_Persian`
`Xpeo`	`Old_Persian`
`Old_Sogdian`	`Old_Sogdian`
`Sogo`	`Old_Sogdian`
`Old_South_Arabian`	`Old_South_Arabian`
`Sarb`	`Old_South_Arabian`
`Old_Turkic`	`Old_Turkic`
`Orkh`	`Old_Turkic`
`Oriya`	`Oriya`
`Orya`	`Oriya`
`Osage`	`Osage`
`Osge`	`Osage`
`Osmanya`	`Osmanya`
`Osma`	`Osmanya`
`Pahawh_Hmong`	`Pahawh_Hmong`
`Hmng`	`Pahawh_Hmong`
`Palmyrene`	`Palmyrene`
`Palm`	`Palmyrene`
`Pau_Cin_Hau`	`Pau_Cin_Hau`
`Pauc`	`Pau_Cin_Hau`
`Phags_Pa`	`Phags_Pa`
`Phag`	`Phags_Pa`
`Phoenician`	`Phoenician`
`Phnx`	`Phoenician`
`Psalter_Pahlavi`	`Psalter_Pahlavi`
`Phlp`	`Psalter_Pahlavi`
`Rejang`	`Rejang`
`Rjng`	`Rejang`
`Runic`	`Runic`
`Runr`	`Runic`
`Samaritan`	`Samaritan`
`Samr`	`Samaritan`
`Saurashtra`	`Saurashtra`
`Saur`	`Saurashtra`
`Sharada`	`Sharada`
`Shrd`	`Sharada`
`Shavian`	`Shavian`
`Shaw`	`Shavian`
`Siddham`	`Siddham`
`Sidd`	`Siddham`
`SignWriting`	`SignWriting`
`Sgnw`	`SignWriting`
`Sinhala`	`Sinhala`
`Sinh`	`Sinhala`
`Sogdian`	`Sogdian`
`Sogd`	`Sogdian`
`Sora_Sompeng`	`Sora_Sompeng`
`Sora`	`Sora_Sompeng`
`Soyombo`	`Soyombo`
`Soyo`	`Soyombo`
`Sundanese`	`Sundanese`
`Sund`	`Sundanese`
`Syloti_Nagri`	`Syloti_Nagri`
`Sylo`	`Syloti_Nagri`
`Syriac`	`Syriac`
`Syrc`	`Syriac`
`Tagalog`	`Tagalog`
`Tglg`	`Tagalog`
`Tagbanwa`	`Tagbanwa`
`Tagb`	`Tagbanwa`
`Tai_Le`	`Tai_Le`
`Tale`	`Tai_Le`
`Tai_Tham`	`Tai_Tham`
`Lana`	`Tai_Tham`
`Tai_Viet`	`Tai_Viet`
`Tavt`	`Tai_Viet`
`Takri`	`Takri`
`Takr`	`Takri`
`Tamil`	`Tamil`
`Taml`	`Tamil`
`Tangut`	`Tangut`
`Tang`	`Tangut`
`Telugu`	`Telugu`
`Telu`	`Telugu`
`Thaana`	`Thaana`
`Thaa`	`Thaana`
`Thai`	`Thai`
`Tibetan`	`Tibetan`
`Tibt`	`Tibetan`
`Tifinagh`	`Tifinagh`
`Tfng`	`Tifinagh`
`Tirhuta`	`Tirhuta`
`Tirh`	`Tirhuta`
`Ugaritic`	`Ugaritic`
`Ugar`	`Ugaritic`
`Vai`	`Vai`
`Vaii`	`Vai`
`Wancho`	`Wancho`
`Wcho`	`Wancho`
`Warang_Citi`	`Warang_Citi`
`Wara`	`Warang_Citi`
`Yezidi`	`Yezidi`
`Yezi`	`Yezidi`
`Yi`	`Yi`
`Yiii`	`Yi`
`Zanabazar_Square`	`Zanabazar_Square`
`Zanb`	`Zanabazar_Square`

Информационные ссылки

Стандарт ECMAScript — Раздел «Atom» — https://tc39.es/ecma262/#sec-atom