Автомобильные коды регионов в 2021 году на номерах России
Добрый день, уважаемый читатель.
В этой статье речь пойдет про государственные регистрационные знаки (автомобильные номера). Номера присваиваются автомобилю во время его регистрации в ГИБДД и остаются на своем месте до тех пор, пока один из следующих владельцев не решит их заменить, либо регистрация автомобиля не будет прекращена.
Регистрационные знаки являются уникальными, т.е. не может существовать одинаковых номеров у двух разных автомобилей одновременно. Номера всегда отличаются хотя бы на одну букву или цифру. Сегодня будут рассмотрены особенности и порядок выдачи автомобильных номеров, а также автомобильные коды регионов на номерах.
Содержание статьи:
Порядок выдачи номеров в России
Рассмотрим самый распространенный вид номеров в Российской Федерации:
Именно такие номера устанавливаются на большинство автомобилей.
На первый взгляд номер состоит из случайной последовательности букв и цифр. На самом деле не все здесь так просто.
На автомобильных номерах используются все цифры от 0 до 9. Однако в отличие от цифр, не все буквы русского алфавита могут оказаться на номерах. Такая привилегия дана только тем буквам, которые имеют схожие по написанию символы в латинском алфавите. Т.е. на автономерах могут использоваться только буквы А, В, Е, К, М, Н, О, Р, С, Т, У, Х.
Об этом факте Вы могли узнать и раньше, но вот следующая мысль наверняка покажется Вам интересной. Речь пойдет о том, в каком порядке выдаются номера.
Номера выдаются по порядку (кроме специальных серий). Однако порядок изменения символов в номере далек от нормального восприятия. Символы меняются не справа налево, а несколько по-другому — в достаточно запутанной последовательности.
1. Чаще всего в автомобильном номере меняется 3я цифра (на рисунке это цифра 6).
После номера Т356ОК будет выдан номер Т357ОК.
2. Второй по частоте изменения символ — 2я цифра (на рисунке 5).
После номера Т359ОК будет выдан номер Т360ОК.
3. Третий по частоте символ — 1я цифра (на рисунке 3).
После номера Т399ОК будет выдан номер Т400ОК.
С цифрами вроде бы все в порядке, но того же самого нельзя сказать о буквах.
4. Четвертый по частоте символ — 1я буква (на рисунке Т).
После номера Т999ОК будет выдан номер У001ОК.
5. Пятый по частоте символ — 3я буква (на рисунке К).
После номера Х999ОК будет выдан номер А001ОМ.
6. Шестой по частоте символ — 2я буква (на рисунке О).
После номера Х999ОХ будет выдан номер А001РА.
Порядок достаточно сложен, так что если не поняли его с первого раза, перечитайте пункты 1-6 еще раз.
Символы в левой части регистрационного знака, которые рассматривались выше, отвечают за номера автомобилей внутри конкретного региона. Кстати, любителям статистики сообщаю, что с одним кодом региона может быть выдано не более чем 1 млн 726 тыс 272 автомобильных регистрационных знаков.
После исчерпания такого лимита происходит изменение номера региона России, записанного в правой части номера. Начиная с этого момента номера начинают выдаваться заново внутри нового региона. Каждому субъекту Российской Федерации соответствует собственный код, а некоторым субъектам федерации, имеющим очень большое число автомобилей, присвоены одновременно несколько кодов региона.
Таблица автомобильных кодов регионов 2021 года
Код | Субъект Российской Федерации |
01 | Республика Адыгея (Адыгея) |
02, 102, 702 | Республика Башкортостан |
03 | Республика Бурятия |
04 | Республика Алтай |
05 | Республика Дагестан |
06 | Республика Ингушетия |
07 | Кабардино-Балкарская Республика |
08 | Республика Калмыкия |
09 | Карачаево-Черкесская Республика |
10 | Республика Карелия |
11 | Республика Коми |
12 | Республика Марий Эл |
13, 113 | Республика Мордовия |
14 | Республика Саха (Якутия) |
15 | Республика Северная Осетия — Алания |
16, 116, 716 | Республика Татарстан (Татарстан) |
17 | Республика Тыва |
18 | Удмуртская Республика |
19 | Республика Хакасия |
21, 121 | Чувашская Республика — Чувашия |
22 | Алтайский край |
23, 93, 123, 193 | Краснодарский край |
24, 124 | Красноярский край |
25, 125 | Приморский край |
26, 126 | Ставропольский край |
27 | Хабаровский край |
28 | Амурская область |
29 | Архангельская область |
30 | Астраханская область |
31 | Белгородская область |
32 | Брянская область |
33 | Владимирская область |
34, 134 | Волгоградская область |
35 | Вологодская область |
36, 136 | Воронежская область |
37 | Ивановская область |
38, 138 | Иркутская область |
39 | Калининградская область |
40 | Калужская область |
41 | Камчатский край |
42, 142 | Кемеровская область |
43 | Кировская область |
44 | Костромская область |
45 | Курганская область |
46 | Курская область |
47, 147 | Ленинградская область |
48 | Липецкая область |
49 | Магаданская область |
50, 90, 150, 190, 750 | Московская область |
51 | Мурманская область |
52, 152 | Нижегородская область |
53 | Новгородская область |
54, 154 | Новосибирская область |
55 | Омская область |
56, 156 | Оренбургская область |
57 | Орловская область |
58 | Пензенская область |
59, 159 | Пермский край |
60 | Псковская область |
61, 161, 761 | Ростовская область |
62 | Рязанская область |
63, 163, 763 | Самарская область |
64, 164 | Саратовская область |
65 | Сахалинская область |
66, 96, 196 | Свердловская область |
67 | Смоленская область |
68 | Тамбовская область |
69 | Тверская область |
70 | Томская область |
71 | Тульская область |
72 | Тюменская область |
73, 173 | Ульяновская область |
74, 174 | Челябинская область |
75 | Забайкальский край |
76 | Ярославская область |
77, 97, 99, 177, 197, 199, 777, 797, 799 | г. Москва |
78, 98, 178, 198 | г. Санкт-Петербург |
79 | Еврейская автономная область |
82 | Республика Крым |
83 | Ненецкий автономный округ |
86, 186 | Ханты-Мансийский автономный округ — Югра |
87 | Чукотский автономный округ |
89 | Ямало-Ненецкий автономный округ |
92 | г. Севастополь |
95 | Чеченская республика |
Устаревшие коды регионов
Код | Субъект Российской Федерации | Примечание |
20 | Чеченская республика | до 2000 года |
80 | Забайкальский край | до 2020 года |
81 | Пермский край | до 2020 года |
84 | Красноярский край | до 2020 года |
85 | Иркутская область | до 2020 года |
88 | Красноярский край | до 2020 года |
91 | Калининградская область | |
94 | Территории, находящиеся за пределами Российской Федерации и обслуживаемые органами внутренних дел Российской Федерации | до 2020 года |
Скачать таблицу автомобильных кодов регионов России
Предлагаю Вам скачать таблицу автомобильных номеров регионов России, предназначенную для печати (нажмите на изображение для увеличения):
Также Вы можете скачать автомобильные коды регионов и в формате pdf:
Трехзначные коды регионов, начинающиеся на цифру 2
В художественных фильмах и телевизионных передачах можно увидеть трехзначные коды регионов начинающиеся на цифру 2 или 3. Например, водители часто интересуются, к какому городу относятся регионы 200, 202, 203, 211, 225, 236, 277 или 303.
До 26 марта 2020 года установка номеров с такими кодами регионов являлась незаконной.
Однако начиная с 26 марта 2020 года в качестве первого символа кода региона может использоваться абсолютно любая цифра. Этот вопрос регламентирован Приложением 1 к приказу «О государственных регистрационных знаках транспортных средств»:
Примечание. На государственных регистрационных знаках транспортных средств, отнесенных к типу 1, допускается применять в трехзначном коде региона в качестве первой цифры кода цифры «1» — «9».
Таким образом, если Вы встретили автомобиль с одним из приведенных выше кодов региона, то Вы можете легко определить место прописки его владельца:
Код | Регион |
202 | Республика Башкортостан |
203 | Республика Бурятия |
211 | Республика Коми |
225 | Приморский край |
236 | Воронежская область |
265 | Сахалинская область |
277 | г. Москва |
303 | Республика Бурятия |
Примечание. В 2021 году номера, где в качестве первого символа кода региона используется цифра 2 или 3, фактически не выдаются, т.к. до указанных серий ГИБДД пока что не дошло.
Что касается номеров с кодами, заканчивающимися двумя нулями, то установка таких номеров является незаконной, т.к. региона с номером 00 не существует.
Кстати, если Вы видели автомобили с номерами регионов, которых нет в приведенной выше таблице, напишите об этом в комментариях.
Обратите внимание, что по количеству автомобильных кодов, принадлежащих тому или иному региону, можно с большой точностью оценить количество транспортных средств в нем. Так число автомобилей в г. Москва в настоящее время около 13,5 миллионов.
Примечание. С 15 октября 2013 года по 31 декабря 2019 года автовладельцы могли официально получить номера с кодом региона, который не соответствует месту их прописки. В этом промежутке было выдано большое количество номеров с «чужими» кодами регионов и такие автомобили на дорогах можно встретить довольно часто. В связи с этим код региона на номерах не всегда совпадает с действительным местом проживания автовладельца.
В 2021 году при регистрации автомобилю присваивается номер с кодом региона, соответствующим прописке автовладельца. Так что со временем на большинстве автомобилей будут установлены номера со своими регионами. И по приведенной выше таблице можно будет понять, из какого региона автовладелец.
А что Вы знаете интересного про автомобильные номера и номера регионов на них?
Удачи на дорогах!
Автокоды регионов
Для чего необходимы автокоды регионов?
Знаки государственной регистрации автомобилю присваивают при оформлении в Госавтоинспекции. Они действительны до их замены владельцем машины.
Гос. номера ТС являются уникальными, имеют отличие друг от друга как минимум в одном символе. Наличие двух одинаковых табличек с регистрационными знаками исключено.
Далее поговорим о том, какие существуют автокоды регионов, как получают гос. номера.
Что называется автомобильным номером?
У каждого государственного знака есть 2 части: слева — серия из 3 букв и регистрационный номер из 3 цифр, справа — код региона, где было оформлено ТС, государственный флаг, буквенное обозначение страны (RUS).
Как получить автономера, изменить их реквизиты?
Гос. номера могут включать какие угодно цифры от 0 до 9, но не каждую букву. По правилам, они содержат лишь те литеры, у которых есть латинские аналоги.
- третья цифра;
- вторая цифра;
- четвертая цифра;
- первая буква;
- третья буква;
- вторая буква
После исчерпания лимита региональный номер, расположенный в правом углу таблички, меняется. Такая процедура приводит к тому, что регистрационные знаки данного региона начинают выдаваться заново.
На нашем портале можно скачать таблицу указанных кодов.
Трехзначные автокоды регионов, начинающиеся с двойки
Люди, разбирающиеся в специфике государственных номеров, часто удивляются когда в кино показывают машины с кодами, где первая цифра — 2.
Итак, что же такое регион 202? Обратимся к Приложению 1 Приказа о государственных регистрационных знаках и ТС. Там сказано, что 3-значные региональные коды должны начинаться с «1» либо «7».
Сегодня местом регистрации автомобиля может стать любой субъект РФ, независимо от прописки его собственника. Так что автокод региона может не совпадать с местом жительства хозяина ТС.
Обобщив все сказанное, добавим, что региональные коды имеют значения как для водителей, так и для пешеходов. Только с их помощью можно распознать конкретный автомобиль, получить сведения о его собственнике.
Вид гос. номеров поможет опытному пользователю установить место регистрации авто, данные его хозяина (обычный гражданин, военнослужащий, дипломатический представитель), структуру, к которой относится машина.
Код | Субъект Российской Федерации |
---|---|
01 | Республика Адыгея |
02, 102 | Республика Башкортостан |
03, 103 | Республика Бурятия |
04 | |
05 | Республика Дагестан |
06 | Республика Ингушетия |
07 | Кабардино-Балкарская Республика |
08 | Республика Калмыкия |
09 | Республика Карачаево-Черкессия |
10 | Республика Карелия |
11 | Республика Коми |
12 | Республика Марий Эл |
13, 113 | Республика Мордовия |
14 | Республика Саха (Якутия) |
15 | Республика Северная Осетия — Алания |
16, 116 | Республика Татарстан |
17 | Республика Тыва |
18 | Удмуртская Республика |
19 | Республика Хакасия |
21, 121 | Чувашская Республика |
22 | Алтайский край |
23, 93, 123 | Краснодарский край |
24, 84, 88, 124 | Красноярский край |
25, 125 | Приморский край |
26, 126 | Ставропольский край |
27 | Хабаровский край |
28 | Амурская область |
29 | Архангельская область |
30 | Астраханская область |
31 | Белгородская область |
32 | Брянская область |
33 | Владимирская область |
34, 134 | Волгоградская область |
35 | Вологодская область |
36, 136 | Воронежская область |
37 | Ивановская область |
38, 85, 138 | Иркутская область |
39, 91 | Калининградская область |
40 | Калужская область |
41 | Камчатский край |
42, 142 | Кемеровская область |
43 | Кировская область |
44 | Костромская область |
45 | Курганская область |
46 | Курская область |
47 | Ленинградская область |
48 | Липецкая область |
49 | Магаданская область |
50, 90, 150, 190, 750 | Московская область |
51 | Мурманская область |
52, 152 | Нижегородская область |
53 | Новгородская область |
54, 154 | Новосибирская область |
55 | Омская область |
56 | Оренбургская область |
57 | Орловская область |
58 | Пензенская область |
59, 81, 159 | Пермский край |
60 | Псковская область |
61, 161 | Ростовская область |
62 | Рязанская область |
63, 163 | Самарская область |
64, 164 | Саратовская область |
65 | Сахалинская область |
66, 96, 196 | Свердловская область |
67 | Смоленская область |
68 | Тамбовская область |
69 | Тверская область |
70 | Томская область |
71 | |
72 | Тюменская область |
73, 173 | Ульяновская область |
74, 174 | Челябинская область |
75, 80 | Забайкальский край |
76 | Ярославская область |
77, 97, 99, 177, 197, 199, 777 | г. Москва |
78, 98, 178 | г. Санкт-Петербург |
79 | Еврейская автономная область |
82 | |
83 | Ненецкий автономный округ |
86, 186 | Ханты-Мансийский автономный округ — Югра |
87 | Чукотский автономный округ |
89 | Ямало-Ненецкий автономный округ |
92 | г. Севастополь |
94 | Территории, находящиеся за пределами РФ и обслуживаемые Департаментом режимных объектов МВД России |
95 | Чеченская республика |
Республика Адыгея | 01 |
Республика Башкортостан | 02, 102 |
Республика Бурятия | 03 |
Республика Алтай | 04 |
Республика Дагестан | 05 |
Республика Ингушетия | 06 |
Кабардино-Балкарская Республика | 07 |
Республика Калмыкия | 08 |
Республика Карачаево-Черкесия | 09 |
Республика Карелия | 10 |
Республика Коми | 11 |
Республика Марий Эл | 12 |
Республика Мордовия | 13, 113 |
Республика Саха (Якутия) | 14 |
Республика Северная Осетия — Алания | 15 |
Республика Татарстан | 16, 116 |
Республика Тыва | 17 |
Удмуртская Республика | 18 |
Республика Хакасия | 19 |
Чеченская республика | 95 |
Чувашская Республика | 21, 121 |
Алтайский край | 22 |
Краснодарский край | 23, 93, 123 |
Красноярский край | 24, 84, 88, 124 |
Приморский край | 25, 125 |
Ставропольский край | 26, 126 |
Хабаровский край | 27, 127 |
Амурская область | 28 |
Архангельская область | 29 |
Астраханская область | 30 |
Белгородская область | 31 |
Брянская область | 32 |
Владимирская область | 33 |
Волгоградская область | 34, 134 |
Вологодская область | 35 |
Воронежская область | 36, 136 |
Ивановская область | 37 |
Иркутская область | 38, 85, 138 |
Калининградская область | 39, 91 |
Калужская область | 40 |
Камчатский край | 41, 82 |
Кемеровская область | 42, 142 |
Кировская область | 43 |
Костромская область | 44 |
Курганская область | 45 |
Курская область | 46 |
Ленинградская область | 47 |
Липецкая область | 48 |
Магаданская область | 49 |
Московская область | 50, 90, 150, 190, 750 |
Мурманская область | 51 |
Нижегородская область | 52, 152 |
Новгородская область | 53 |
Новосибирская область | 54, 154 |
Омская область | 55 |
Оренбургская область | 56 |
Орловская область | 57 |
Пензенская область | 58 |
Пермский край | 59, 81, 159 |
Псковская область | 60 |
Ростовская область | 61, 161 |
Рязанская область | 62 |
Самарская область | 63, 163 |
Саратовская область | 64, 164 |
Сахалинская область | 65 |
Свердловская область | 66, 96, 196 |
Смоленская область | 67 |
Тамбовская область | 68 |
Тверская область | 69, 169 |
Томская область | 70 |
Тульская область | 71 |
Тюменская область | 72 |
Ульяновская область | 73, 173 |
Челябинская область | 74, 174 |
Забайкальский край | 75, 80 |
Ярославская область | 76 |
Москва | 77, 97, 99, 177, 199, 197, 777 |
Санкт-Петербург | 78, 98, 178 |
Еврейская автономная область | 79 |
Республика Крым | 82 |
Ненецкий автономный округ | 83 |
Ханты-Мансийский автономный округ Югра | 86, 186 |
Чукотский автономный округ | 87 |
Ямало-Ненецкий автономный округ | 89 |
Севастополь | 92 |
Байконур | 94 |
01 | Республика Адыгея | 48 | Липецкая область |
02, 102 | Республика Башкортостан | 49 | Магаданская область |
03 | Республика Бурятия | 50, 90, 150 | Московская область |
04 | Республика Алтай | 51 | Мурманская область |
05 | Республика Дагестан | 52 | Нижегородская область |
06 | Республика Ингушетия | 53 | Новгородская область |
07 | Кабардино-Балкарская Республика | 54, 154 | Новосибирская область |
08 | Республика Калмыкия | 55 | Омская область |
09 | Карачаево-Черкесская Республика | 56 | Оренбургская область |
10 | Республика Карелия | 57 | Орловская область |
11 | Республика Коми | 58 | Пензенская область |
12 | Республика Марий Эл | 59, 159 | Пермский край |
13 | Республика Мордовия | 60 | Псковская оласть |
14 | Республика Саха-Якутия | 61, 161 | Ростовская область |
15 | Республика Северная Осетия-Алания | 62 | Рязанская область |
16, 116 | Республика Татарстан | 63, 163 | Самарская область |
17 | Республика Тыва | 64 | Саратовская область |
18, 118 | Удмуртская Республика | 65 | Сахалинская область |
19 | Республика Хакасия | 66, 96 | Свердловская область |
20 | Республика Чечня | 67 | Смоленская область |
21, 121 | Чувашская Республика — Чувашия | 68 | Тамбовская область |
22 | Алтайский край | 69 | Тверская область |
23, 93 | Краснодарский край | 70 | Томская область |
24 | Красноярский край | 71 | Тульская область |
25, 125 | Приморский край | 72 | Тюменская область |
26 | Ставропольский край | 73, 173 | Ульяновская область |
27 | Хабаровский край | 74, 174 | Челябинская область |
28 | Амурская область | 75 | Читинская область |
29 | Архангельская область | 76 | Ярославская область |
30 | Астраханская область | 77 | Москва |
31 | Белгородская область | 78 | Санкт-Петербург |
32 | Брянская область | 79 | Еврейская авт. область |
33 | Владимирская область | 80 | Агинский Бурятский авт. округ |
34 | Волгоградская область | 81 | Коми-Пермяцкий авт. округ |
35 | Вологодская область | 82 | Корякский авт. округ |
36 | Воронежская область | 83 | Ненецкий авт. округ |
37 | Ивановская область | 84 | Таймырский авт. округ |
38, 138 | Иркутская область | 85 | Усть-Ордынский Бурятский авт. окр. |
39 | Калининградская область | 86 | Ханты-Мансийский авт. округ — Югра |
40 | Калужская область | 87 | Чукотский авт. округ |
41 | Камчатская область | 88 | Эвенкийский авт. округ |
42 | Кемеровская область | 89 | Ямало-Ненецкий авт. округ |
43 | Кировская область | 90 | Московская область |
44 | Костромская область | 95 | Чеченская республика |
45 | Курганская область | 98 | Санкт-Петербург |
46 | Курская область | 99 | Москва |
47 | Ленинградская область | Остальные — резерв |
Nga tohu-a-rohe o nga rohe o Russia. Me pehea e mohio ai kei hea te rohe kua rehitatia he motuka?
Ko te maha o nga motuka, me nga kaieke taraiwa, e tipu haere ana i ia tau. I nga taone nui, kua roa te whanganga o te tawhiti kaore i nga kiromita, engari i nga haora e tu ana i nga huarahi. I te nuinga o nga wa, ka tiimata te tirotiro o nga kaiarataki hōhā, me te kite atu ehara i etahi atu motuka i te takiwa, engari me a raatau raihana Ana mena ka taea e koe te tiaki motuka me te waehere o tetahi rohe rereke, ka tino hiahia, engari no hea, na te mea «te hoa tata»? Ka awhina nga Autocodes o nga rohe o Ruhia ki te whakautu i tenei patai.
Nga raihana raihana o nga motuka Ruhia
Ko te nuinga o nga raihana raihana ka kitea i nga rori o Russia e pa ana ki te paerewa kua whakaaetia i te tau 1993. Hei ki taana, ko te nama motuka ano e toru nga reta me nga nama e 3, kei reira nga reta e tohu ana i te raupapa, me nga nama — ko te nama ake. Kia mahara ko te taatai reta katoa a Ruhia, e 12 noa iho nga reta e whakamahia ana, e whai reta ana ki te taatai reta Latina. Ko te whakakotahitanga o nga nama tetahi mea mai i te 001 ki te 999. He maama noa ki te tatau kaore e neke atu i te 726 mano 272 nga kiripuaki ka taea te hanga.
Heoi, neke atu i te 50 miriona nga motuka kua rēhita kē i Ruhia. Engari me pehea te rahi o te waahi mo te katoa? Ko te meka ko nga autocodes o nga rohe o Russia kei te taha matau o te tohu. I te timatanga, e 89, engari Tuhinga o mua mo Hanuere 1993. Heoi, i nga ra kei te heke mai, na te mea i te maha o nga rohe (ko Moscow me St. Petersburg) he maha ake nga motuka, i whakatauhia kia whakauru i nga autocodes o nga taone nui o Ruhia, ka tiimata mai i te 9, ka tino uru ki roto. 3 mati. Ae ra, ko Moscow te tuatahi o nga hinonga. I tenei ra, ko nga rohe 19 anake e ahei ana ki te whakamanamana i taua kaupapa.
Ripanga. Tuhinga o mua o Russia
Waehere | Wāhi | Waehere | Wāhi | Waehere | Wāhi |
01 | Adygea | 32 | Bryansk | 62 | Ryazan |
02, 102 | Bashkortostan | 33 | Владимир | 63, 163 | Samara |
03 | Buryatia | 34, 134 | Volgograd | 64, 164 | Saratov |
04 | Altai | 35 | Vologda | 65 | Sakhalin |
05 | Dagestan | 36, 136 | Voronezh | 66, 96, 196 | Екатеринбург |
06 | Tuhinga | 37 | Ivanovo | 67 | Smolensk |
07 | Kabardino-Balkaria | 38, 85, 138 | Иркутск | 68 | Tambov |
08 | Kalmykia | 39, 91 | Kaliningrad | 69 | Tver |
09 | Karachay-Cherkessia | 40 | Kaluga | 70 | Tomsk |
10 | Karelia | 41, 82 | Kamchatka | 71 | Tula |
11 | Komi | 42, 142 | Kemerovo | 72 | Тюмень |
12 | Mari El | 43 | Киров | 73, 173 | Ulyanovsk |
13, 113 | Mordovia | 44 | Kostroma | 74, 174 | Chelyabinsk |
14 | Yakutia | 45 | Kurgan | 75, 80 | Transbaikalia |
15 | North Ossetia Alania | 46 | Kursk | 76 | Ярославль |
16, 116 | Tatarstan | 47 | Leningrad rohe | 77, 97, 99, 177, 197, 199, 777 | Москва |
17 | Tyva | 48 | Lipetsk | 78, 98, 178 | Saint Petersburg |
18 | Udmurtia | 49 | Magadan | 79 | Te Rohe Takitahi o nga Hurai |
19 | Khakassia | 50, 90, 150, 190, 750 | Te rohe o Moscow | 82 | Crimea |
21, 121 | Chuvashia | 51 | Murmansk | 83 | Nenets Takiwa motuhake |
22 | Altai | 52, 152 | Nizhny Novgorod | 86, 186 | Khanty-Mansiysk |
23, 93, 123 | Krasnodar me te rohe | 53 | Novgorod | 87 | Chukotka |
24, 84, 88, 124 | Krasnoyarsk me te rohe | 54, 154 | Новосибирск | 89 | Ko te Okrug Motuhake a Yamal-Nenets |
25, 125 | Primorye | 55 | Омск | 92 | Sevastopol |
26, 126 | Rohe Stavropol | 56 | Orenburg | 94 | Baikonur |
27 | Хабаровск | 57 | Eagle | 95 | Chechnya |
28 | Amur rohe | 58 | Penza | ||
29 | Arkhangelsk | 59, 81, 159 | Пермь | ||
30 | Astrakhan | 60 | Pskov | ||
31 | Belgorod | 61, 161 | Rostov-na-Donu |
I a koe e ako ana i te teepu, ka marama te whakaaro ki te toha i nga autocodes ki nga rohe. He raupapa taatai reta a raatau e pa ana ki nga ingoa o nga kawanatanga tuatahi, katahi nga rohe, rohe me nga okrug motuhake Pono, i tenei wa, na te mea i muri o te 1993 kaore ano kia rereke nga rohe o te Kaunihera o Ruhia a ko etahi o ratau kua uru noa ki etahi atu, kei reira tonu tetahi «raru» iti i roto i tenei punaha.
Ko etahi atu pereti raihana
I runga i te huarahi, ka taea tonu e koe te kite i nga papa raihana tawhito, he maha noa iho nga nama me nga reta o te taatai Kirikiri. Ko te mea ke i muri o te whakaurutanga o nga ture hou, kei te haere tonu nga papa raihana i tukuna i mua. Na, ko te mea tawhito rawa, ko te tauira o te 1947, he kowhai. Mai i te 1958, he pango te pereti raihana, e 4 nga tau, ka wehea e te tohuhono, ka whai 3 nga reta. Ana mai i te 1980 he 4 ano nga nama me nga reta e 3, engari kua pango noa te ahua ma. Me mahara ko nga reta i te Tau Soviet He autocodes hoki o nga rohe.
Me maarama ko nga ture mo te rehita motuka, i whakauruhia i tera tau, ka ahei te pupuri i nga pereti raihana me te whakakore rawa i te punaha autocode o naianei. Inaianei ko te noho mai o te waehere ka korero noa mo te waahi rehitatanga o te motuka, engari kaore mo te rehitatanga a ona rangatira. Hei taapiri, kua ngaro te hiahia mo nga raihana raihana whakawhiti.
Коды регионов России для автомобилистов
Коды регионов РФ для автомобилистов — применяются на государственных регистрационных знаках транспортных средств и другой специальной продукции, необходимой для допуска транспортных средств и их водителей к участию в дорожном движении. Включая новые трехзначные коды, действующие с 2008 года
01 — Республика Адыгея
02, 102 — Республика Башкортостан 03 — Республика Бурятия 04 — Республика Алтай 05 — Республика Дагестан 06 — Ингушская Республика 07 — Кабардино-Балкария 08 — Республика Калмыкия 09 — Карачаево-Черкессия 10 — Республика Карелия 11 — Республика Коми 12 — Республика Марий Эл 13 — Республика Мордовия 14 — Республика Саха (Якутия) 15 — Северная Осетия 16, 116 — Татарстан 17 — Республика Тува 18 — Удмуртская Республика 19 — Хакасия 20, 95 — Чеченская Республика 21, 121 — Чувашская Республика 22 — Алтайский край 23, 93 — Краснодарский край 24 — Красноярский край 25, 125 — Приморский край 26 — Ставропольский край 27 — Хабаровский край 28 — Амурская область 29 — Архангельская область 30 — Астраханская область 31 — Белгородская область 32 — Брянская область 33 — Владимирская область 34 — Волгоградская область 35 — Вологодская область 36 — Воронежская область 37 — Ивановская область 38 — Иркутская область 39 — Калининградская область 40 — Калужская область 41 — Камчатская область 42 — Кемеровская область 43 — Кировская область 44 — Костромская область 45 — Курганская область |
46 — Курская область
47 — Ленинградская область 48 — Липецкая область 49 — Магаданская область 50, 90, 150 — Московская область 51 — Мурманская область 52, 152 — Нижегородская область 53 — Новгородская область 54 — Новосибирская область 55 — Омская область 56 — Оренбургская область 57 — Орловская область 58 — Пензенская область 59 — Пермская область 60 — Псковская область 61, 161 — Ростовская область 62 — Рязанская область 63, 163 — Самарская область 64, 164 — Саратовская область 65 — Сахалинская область 66, 96 — Свердловская область 67 — Смоленская область 68 — Тамбовская область 69 — Тверская область 70 — Томская область 71 — Тульская область 72 — Тюменская область 73 — Ульяновская область 74, 174 — Челябинская область 75 — Читинская область 76 — Ярославская область 77, 97, 99, 177, 199 — Москва 78, 98, 178 — Санкт-Петербург 79 — Еврейская автономная область 80 — Агинский Бурятский автономный округ 81 — Коми-Пермяцкий автономный округ 82 — Корякский автономный округ 83 — Ненецкий автономный округ 84 — Таймырский автономный округ 85 — Усть-Ордынский Бурятский автономный округ 86 — Ханты-Мансийский автономный округ 87 — Чукотский автономный округ 88 — Эвенкийский автономный округ 89 — Ямало-Ненецкий автономный округ 91, 92, 94 — Резерв МВД России |
Коды городов и областей РФ.
Саратов | В МВД предложили новые комбинации кодов регионов для автономеров
В МВД России предложили ввести изменения в комбинации цифр кодов автомобильных номеров, установив для некоторых российских регионов трехзначный код. Соответствующая инициатива содержится в проекте ведомственного приказа «О государственных регистрационных знаках транспортных средств» который опубликован на Федеральном портале проектов нормативных правовых актов.
Согласно опубликованной информации, в случае принятия документа ГИБДД сможет выдавать номера с трехзначными кодами регионов, чьи коды в настоящее время начинаются с цифр 2, 3, 4, 5, 6, 8 и 9. На данный момент трехзначный код мог начинаться только с 1 или 7. В частности, «предлагается расширение количества возможных циферных комбинаций за счет введения дополнительных цифр, с которых может начинаться код региона».
Стоит отметить, что например, автовладельцам Алтайского края будут присваивать номера с кодом 222, Омской области – 555, Свердловской области – 666. По данным ТАСС, в настоящее время инициатива находится на стадии общественных обсуждений.
Ранее в «Стране советов» сообщалось, что МВД предлагает штрафовать родителей курящих детей.
Автор: Александра Малыгина
Ещё новости о событии:
В России появятся новые трехзначные автокоды регионов
Трёхзначный код региона на автомобильных номерах, начинающийся с цифр от 2 до 9, предлагает установить МВД России.
09:22 04.02.2020 Balashover.Ru — Балашов
МВД вводит новые комбинации в коды регионов для госзнаков
Подразделениям ГИБДД РФ разрешат выдавать номера с трёхзначными кодами регионов, начинающимися с цифр 2, 3, 4, 5, 6, 8 и 9. Соответствующие изменения вносятся в приказ МВД.
20:02 03.02.2020 ГТРК Саратов — Саратов
В МВД предложили новые комбинации кодов регионов для автономеров
В МВД России предложили ввести изменения в комбинации цифр кодов автомобильных номеров, установив для некоторых российских регионов трехзначный код.
17:41 03.02.2020 Sovetov.Su — Саратов
МВД вводит новые цифры в автомобильные номера
В России подразделениям ГИБДД разрешат выдавать номера с трехзначными кодами регионов, начинающимися с цифр 2, 3, 4, 5, 6, 8 и 9. Соответствующие изменения вносятся в приказ МВД, сообщает сегодня » Коммерсантъ «.
В Москве,
10:41 03.02.2020 ИА Взгляд-инфо — Саратов
В Саратовской области могут появиться автономера с новым трехзначным кодом
МВД России предложило выдавать регистрационные номера для транспорта с трехзначными кодами регионов,
10:35 03.02.2020 ИА Версия-Саратов — Саратов
В МВД хотят внести изменения в комбинации цифр для автомобильных номеров
Некоторые регионы могут получить трехзначный код Фото: pixabay.com
МВД РФ предложило внести некоторые изменения в комбинации цифр кодов для автомобильных номеров: некоторые регионы могут получить трехзначный код.
10:34 03.02.2020 Четвертая Власть — Саратов
Прогнозирование неупорядоченных участков в белках с использованием профилей аминокислотных индексов
BMC Bioinformatics. 2009; 10 (Дополнение 1): S42.
, 1 , 1 и 2Pengfei Han
1 Школа компьютерных наук и информационных технологий, Университет RMIT, Мельбурн, Виктория 3001, Австралия
Xiuzhen Zhang
Школа 1 Компьютерные науки и информационные технологии, Университет RMIT, Мельбурн, VIC 3001, АвстралияZhi-Ping Feng
2 Институт медицинских исследований Уолтера и Элизы Холл, Parkville, VIC 3050, Австралия
1 Школа компьютерных наук и ИТ, Университет RMIT, Мельбурн, VIC 3001, Австралия
2 Институт медицинских исследований Уолтера и Элизы Холл, Парквилл, Виктория 3050, Австралия
Автор, отвечающий за переписку.Приложение
Избранные доклады Седьмой Азиатско-Тихоокеанской конференции по биоинформатике (APBC 2009)
Майкл К Чжан, Майкл С. Уотерман и Сюэгун Чжан
КонференцияСедьмая Азиатско-Тихоокеанская конференция по биоинформатике (APBC 2009)
13–16 Январь 2009 г.
Пекин, Китай
Авторские права © 2009 Han et al; лицензиат BioMed Central Ltd.Это статья в открытом доступе, распространяемая в соответствии с условиями лицензии Creative Commons Attribution License (http: // creativecommons.org / licenses / by / 2.0), что разрешает неограниченное использование, распространение и воспроизведение на любом носителе при условии правильного цитирования оригинальной работы.
Эта статья цитируется в других статьях в PMC.Abstract
Предпосылки
Внутренне неструктурированные или неупорядоченные белки являются обычными и функционально важными. Прогнозирование неупорядоченных областей в белках может предоставить полезную информацию для понимания функции белков и для высокопроизводительного определения белковых структур.
Результаты
В этой статье представлены алгоритмы для прогнозирования длинных и коротких неупорядоченных областей в белках, а именно алгоритм прогнозирования длинных неупорядоченных областей DRaai-L и алгоритм прогнозирования коротких неупорядоченных областей DRaai-S. Эти алгоритмы разработаны на основе модели машинного обучения случайного леса и профилей аминокислотных индексов, представляющих различные физико-химические и биохимические свойства 20 аминокислот.
Заключение
Эксперименты на DisProt3.6 и CASP7 демонстрируют, что некоторые наборы аминокислотных индексов имеют сильную ассоциацию с упорядоченным и неупорядоченным статусом остатков. Наши алгоритмы, основанные на профилях этих аминокислотных индексов в качестве входных функций для прогнозирования неупорядоченных областей в белках, превосходят алгоритмы, основанные на аминокислотном составе и уменьшенном аминокислотном составе, а также превосходят многие существующие алгоритмы. Наши исследования показывают, что профили аминокислотных индексов в сочетании с моделью обучения случайного леса являются важным дополнительным методом для точного определения неупорядоченных областей в белках.
Предпосылки
Белки представляют собой линейные цепи, состоящие из 20 аминокислот (а.о.), также называемые остатками, когда они образуют цепи путем отделения молекул воды, связаны вместе полипептидными связями и сложены в сложные трехмерные (3D) структуры. Неупорядоченные области (DR) в последовательности белка являются структурно гибкими и обычно имеют низкую сложность последовательности [1-4]. Физико-химически DR обогащены заряженными или полярными аминокислотами и обеднены гидрофобными аминокислотами [5-7].Белки, содержащие длинные DR, называются внутренне неструктурированными или неупорядоченными белками (IUP или IDP).
Ряд предикторов белковых нарушений был разработан несколькими группами, такими как PONDR [8], RONN [9,10], DisProt [11,12], NORSp [13,14], DISpro [15], DISOPRED и DISOPRED2 [16,17], DisEMBL [18], IUPred [19], DRIP-PRED [20] и Spritz [21], а также недавно DisPSSMP [22], VSL1 и VSL2 [23,24], POODLE-L [ 25], POODLE-S [26], Ucon [27], PrDOS [28] и metaPrDOS [29]. Большинство существующих предикторов основаны на моделях машинного обучения нейронной сети и опорных векторов.Функции, используемые для построения моделей прогнозирования, включают аминокислотный состав (AAC) или состав восстановленных аминокислот (RAAC) в сочетании с физико-химическими свойствами аминокислот, включая ароматичность, чистый заряд, гибкость, гидропатию, координационное число и сложность последовательности [8-10 ]. Для достижения высокой точности прогнозирования алгоритмы обычно используют в качестве входных данных множество функций. Некоторые алгоритмы основаны на оценках выравнивания последовательностей из PSI-BLAST или информации о вторичной структуре белка [16,17,21].Любой из подходов снижает эффективность этих алгоритмов и препятствует их применению в высокопроизводительном анализе.
Было показано, что короткие неупорядоченные области имеют характеристики, отличные от длинных неупорядоченных областей [30]. Алгоритмы хорошо работают при прогнозировании длинных неупорядоченных областей, редко хорошо работают при прогнозировании коротких неупорядоченных областей. В этой статье алгоритмы прогнозирования коротких и длинных DR разрабатываются отдельно на основе модели обучения Random Forest [31] и профилей аминокислотных индексов.Алгоритм для длинных неупорядоченных областей, DRaai-L, может достичь 85,1% площади под кривыми рабочих характеристик приемника (ROC) в 10-кратном перекрестном проверочном тесте. Алгоритм DRaai-S, нацеленный на все виды неупорядоченных областей, может достичь 81,2% площади под кривой ROC в 10-кратном перекрестном проверочном тесте и около 72,2% в слепом тесте на мишенях CASP7. И DRaai-L, и DRaai-S обеспечивают более высокую точность прогнозирования, а также более высокую эффективность вычислений, чем многие существующие алгоритмы, что делает их эффективными инструментами для высокопроизводительного прогнозирования неупорядоченных областей в белках.
Данные обучения и тестирования
В этом исследовании данные обучения получены из DisProt (версия 3.6) [32] и PDB-Select-25 (версия от октября 2004 г.) [33]. DisProt — это набор неупорядоченных участков белков, основанный на описаниях в опубликованной литературе. Он имеет 472 записи белков и 1121 неупорядоченную область. Только длинные неупорядоченные области (> 30aa) в DisProt3.6 используются для обучения DRaai-L, и в дальнейшем он обозначается как DL-train . Все неупорядоченные области в DisProt3.6 использовались для обучения DRaai-S, и далее он обозначается как DS-train . Упорядоченные данные обучения извлекаются из PDB-Select-25, репрезентативного набора цепочек банка данных белка (PDB), который показывает менее 25% гомологии последовательностей. Мы выбрали 366 сегментов высокого разрешения (<2 Å) с четко определенными структурами, которые не имеют отсутствующих координат основной или боковой цепи и содержат не менее 80 остатков. Этот набор упорядоченного обучающего набора включает в себя в общей сложности 80324 остатка и в дальнейшем будет обозначаться как O-train .Цели CASP7 использовались в качестве независимого тестового набора данных для слепой проверки эффективности прогнозирования. Неправильное содержимое CASP7 сильно отличается от DisProt3.6. Набор данных CASP7 содержит 96 последовательностей с общим количеством 19 891 остатка, из которых только 170 неупорядоченных областей или 1189 (6%) остатков аннотированы как неупорядоченные. Существует значительное количество (28% в а.о.) коротких неупорядоченных областей, содержащих 1 или 2 а.о., и только 4 являются длинными DR> 30 а.о. (<2% по а.о.). Пока DisProt3.6 содержит 352 области> 30 а.о., всего 47251 а.о. (36% а.о.).
Аминокислотные индексы и выбор признаков
База данных аминокислотных индексов (AA-index) AAindex [34] — это база данных числовых индексов, представляющих различные физико-химические и биохимические свойства аминокислот или пар аминокислот. В частности, база данных AAindex1 содержит 544 набора числовых индексов для 20 аминокислот, и все они взяты из опубликованной литературы.
AA-индексы, которые сильно коррелируют с неупорядоченным или упорядоченным статусом остатков в последовательностях обучающего белка, были использованы для построения модели прогнозирования в наших исследованиях.Процесс выбора этих индексов был реализован в три этапа. Прежде всего, учитывая набор индексов и обучающую последовательность, обучающая последовательность преобразуется в два вектора V → 1 и V → 2. V → 1 генерируется заменой упорядоченных и неупорядоченных резиденций числами -1 и 1 соответственно на основе аннотаций из баз данных. V → 2 — результат замены кода аминокислоты на соответствующее значение AA-индекса.
Обратите внимание, что, поскольку разные наборы AA-индекса имеют разные масштабы в базе данных AA-индекса, Z-преобразование ( P ′ r ) применяется для каждого набора индексов перед заменой.Для набора AA-индекса преобразование Z показано в уравнении 1.
P r представляет значение AA-индекса, а r изменяется для 20 аминокислот, обозначенных как 1. .20. P¯ и σ — среднее и стандартное отклонение 20 значений индекса AA:
и
σ = 120∑r = 120 (Pr − P¯) 2
(3)
После AA- При подстановке индекса структурное влияние на остаток со стороны его окружения рассчитывается с использованием гладкой функции.Фильтр Савицкого-Голея [35] используется для сглаживания как V → 1, так и V → 2 в нашем исследовании с окном 17 а.о. Этот фильтр по существу выполняет полиномиальную регрессию по V → 1 и V → 2, чтобы определить сглаженное значение для каждой точки. Основным преимуществом метода Савицкого-Голея является сохранение характеристик распределения, таких как относительный максимальный балл, минимальный балл и ширина неупорядоченных или упорядоченных областей, которые обычно «сглаживаются» другими гладкими методами. Сглаженные векторы V → 1 ′ и V → 2 ′ обозначают результаты фильтрации V → 1 и V → 2 соответственно.
Наконец, вычисляется коэффициент корреляции набора AA-индексов и белковой последовательности, как показано в уравнении 4, где N представляет длину рассматриваемой последовательности.
RV → 1′V → 2 ′ = ∑r = 1N (V → 1′ − V → ¯1 ′) (V → 2′ − V → ¯2 ′) (N − 1) σV → 1, σV → 2 ′
(4)
Коэффициент корреляции RV → 1′V → 2 ′ находится в диапазоне [-1..1]. Положительный коэффициент указывает на то, что набор AA-индексов положительно коррелирует со статусом порядка / беспорядка остатков в последовательности, тогда как отрицательный коэффициент указывает на отрицательную корреляцию.
Наборы AA-индексов, которые в основном связаны с состоянием беспорядка / порядка остатков во всех наших обучающих последовательностях, были использованы для построения модели прогнозирования. В частности, эти наборы индексов были выбраны так, чтобы
• Максимизировать суммирование абсолютных коэффициентов корреляции индекса по всем обучающим последовательностям.
• Для максимального увеличения количества белковых последовательностей, с которыми равномерно коррелирует индекс.
На основании двух вышеуказанных критериев были отобраны 40 лучших наборов индекса AA.Среди 40 наборов многие сильно коррелированы (с коэффициентом корреляции не менее 0,8), и в результате были отобраны пять репрезентативных наборов индексов, как показано в таблице.
Таблица 1
Аминокислотные индексы, относящиеся к (не) порядку. Пять наборов аминокислотных индексов, которые наиболее коррелируют с (не) порядком белков, являются функциями, используемыми в прогнозировании.
Набор AA-индексов | Описание |
VINM940102 | Нормализованные параметры гибкости (B-значения) для каждого остатка, окруженного нежесткими соседями |
BULH740101 Поверхностное натяжение растворов аминокислот 9015 : Шкала гидрофобности аминокислотных остатков | |
PUNT030102 | Основанная на знаниях шкала мембранной склонности из 3D_Helix в базах данных MP-topo |
CHOP780203 | Нормализованная частота бета-поворота |
Из описания этих 5 наборов AA-индексов, перечисленных в таблице, мы можем видеть, что они сильно коррелируют со структурами белков.Например, индекс BULH740101 представляет гидрофобность, в то время как известно, что упорядоченные области имеют тенденцию быть гидрофобными, индексы CHOP780203 и CHOP780211 представляют альфа-склонность и склонность к повороту, что широко используется в предсказании вторичной структуры.
Автокорреляционные функции Моро-Брото AA-индексов
Профили аминокислотных индексов вдоль последовательности белка использовались в исследованиях структурной и функциональной классификации белков [36-38]. Учитывая набор AA-индексов, нормализованный коэффициент автокорреляции Моро-Брото для аминокислотной белковой последовательности определяется в уравнении 5:
AC (d) = 1N − d × ∑i = 1N − dPiPi + d
(5)
, где N — длина рассматриваемой последовательности, а d — целое число больше нуля и описывают отставание автокорреляции или расстояние в количестве остатков, разделенных в последовательности белка.В этом исследовании d установлено на 1..30. P i и P i + d — значения индекса AA в позициях i и i + d , нормализованные Z-преобразованием соответственно. Мы использовали автокорреляционные функции Моро-Брото, сгенерированные из сглаженного вектора V → 2 ′ под разными окнами, в качестве входных данных для разработки алгоритма DRaai-L, а также использовали вектор RV → 1′V → 2 ′ = ∑r = 1N (V → 1 ′ −V → ¯1 ′) (V → 2′ − V → ¯2 ′) (N − 1) σV → 1, σV → 2 ′ непосредственно для разработки алгоритма DRaai-S.
Методы
Модель машинного обучения случайного леса является базовой моделью в этом исследовании. Случайный лес — это совокупность необрезанных деревьев решений, где каждое дерево выращивается с использованием подмножества (начальной загрузки) обучающего набора данных [39]. Bootstrap — это обучающий набор, выбранный случайным образом из исходного обучающего набора с равным количеством обучающих выборок. Каждое дерево, созданное из образцов начальной загрузки, вырастает до полной длины, и количество деревьев в лесу можно регулировать. После обучения каждый путь от корня дерева до листа дает одно правило «если-то» и может использоваться для прогнозирования.В качестве модели машинного обучения ансамбля случайный лес не имеет риска переобучения растущим числом деревьев. Однако после определенного момента увеличение количества деревьев приводит к незначительному повышению точности предсказания, значительно увеличивая время обучения и предсказания. Реализация случайного леса пакета интеллектуального анализа данных WEKA [40] используется для построения наших моделей.
DRaai-L: прогнозирование длинных DR с использованием AA-индексов.
DL-train и O-train используются для обучения алгоритма DRaai-L.Для каждой упорядоченной или неупорядоченной области в наборах данных DL-train и O-train окно w aa (по умолчанию w = 31) скользит по последовательности от N-конца к C-концу. остаток за раз. Автокорреляция Моро-Брото 5 наборов AA-индексов в каждом окне вычисляется с d , назначенными от 1..30. Итак, n = 5 × 30 = 150 элементов генерируются из окна. Когда окно из остатков скользит вдоль последовательности белка из L i остатков, последовательность представлена элементами ( L i / w ) × n элементов.Эти элементы используются в качестве входных параметров случайного леса для обучения модели DRaai-L.
Для последовательности запроса окно скользит по последовательности, и соответствующие ему векторы V → 2 ‘вычисляются с использованием автокорреляционных функций Моро-Брото. Сглаженные векторы V → 2 ‘затем вводятся в модель DRaai-L, и прогнозируется неупорядоченный / упорядоченный статус каждого остатка.
DRaai-S: прогнозирование коротких DR с использованием AA-индексов
Все неупорядоченные области в DisProt3.6, DS-train использовались для обучения DRaai-S.Каждая аминокислотная последовательность в обучающем наборе была заменена числовыми последовательностями на 5 наборов AA-индексов и сглажена с использованием фильтра Савицкого-Голея (с окном 17 а.о.). Затем сглаженные векторы V → 2 ‘непосредственно используются в качестве входных параметров для разработки модели DRaai-S,
Для прогнозирования беспорядка в последовательности запроса последовательность преобразуется аналогично 5 сглаженным векторам V → 2′, а затем они вводятся в модель DRaai-S для прогнозирования беспорядка / порядка каждого остатка.
Оценка
Распределение упорядоченных / неупорядоченных остатков очень несбалансированно как в DisProt3.6, так и в CASP7. Учитывая тот факт, что неупорядоченные остатки составляют меньшинство в обеих базах данных, общая точность (Q2) не является хорошим показателем для оценки алгоритмов прогнозирования нарушений [41]. В идеале алгоритм беспорядка должен быть высокочувствительным к неупорядоченным областям, но не давать ложноположительных прогнозов. Матрица неточностей алгоритма, которая состоит из истинных положительных (TP), ложноположительных (FP), истинно отрицательных (TN) и ложноотрицательных (FN), может использоваться для оценки производительности алгоритма.Обратите внимание, что в контексте предсказания беспорядка P и N — это общее количество помеченных неупорядоченных и упорядоченных остатков соответственно.
Кривые рабочих характеристик приемника (ROC) использовались для оценки точности прогноза. Каждая точка кривой ROC определяется парой значений для частоты ложных срабатываний (x = FP / N) и истинных положительных результатов (y = TP / P). Для алгоритма прогнозирования, регулируя параметры, можно построить график истинных положительных результатов при различных уровнях ложных срабатываний и получить гладкую кривую ROC.
Производительность DRaai-L и DRaai-S измеряется различными методами, как описано ниже.
• Чувствительность — это истинно положительный показатель, который представляет собой процент остатков, правильно предсказанных как неупорядоченные, по отношению к общему количеству фактических неупорядоченных остатков.
• Точность — это процент истинных положительных результатов по отношению к общему количеству прогнозируемых положительных результатов.
• Специфичность — это процент остатков, правильно спрогнозированных в порядке упорядочения, по отношению к общему количеству упорядоченных остатков.Частота ложных срабатываний равна 1-специфичности.
• S продукт — это единичное измерение, сочетающее чувствительность и специфичность: S продукт = Чувствительность × специфичность. S продукт способствует прогнозированию нарушений.
• Коэффициент корреляции Мэтью (MCC) находится в диапазоне от -1 до +1 и способствует правильному предсказанию неупорядоченных остатков. MCC определяется как
TP × TN-FP × FN (TP + FP) × (TP + FN) × (TN + FP) × (TN + FN).
• S w — это измерение, которое присваивает веса классов, которые обратно связаны с распределением классов. В результате S w награждает модели за правильное предсказание неупорядоченного остатка. S w использовали для оценки предсказания неупорядоченных остатков в CASP6 и CASP7. S w определяется как
Wdisorder × TP − Worder × FP + Worder × TN − Wdisorder × FNWdisorder × P + Worder × N,
, где W беспорядок и W порядок — веса для беспорядка и порядка соответственно. W беспорядок и W порядок должен быть установлен обратно пропорциональным беспорядку и содержанию порядка в рассматриваемых данных. Для оценки на DisProt3.6, W беспорядок = 85 и W порядок = 15. Для оценки на CASP7, W беспорядок = 94 и W заказ = 6.
Используемый нами пакет случайных лесов предоставляет тест вне сумки для оценки частоты ошибок прогнозирования с использованием данных, случайно удерживаемых на каждой итерации построения дерева. Однако этот подход значительно переоценивает производительность при использовании оконной техники.
Производительность как DRaai-L, так и DRaai-S оценивается на DisProt3.6 с использованием 10-кратной перекрестной проверки. Производительность DRaai-S дополнительно оценивается слепым тестом на целевых объектах CASP7.
DRaai-L и DRaai-S сравниваются с алгоритмами, основанными на модели случайного леса, но построенными с использованием аминокислотного состава (AAC) и сокращенной информации AAC (RAAC) [42] о первичных последовательностях.Они также сравниваются с другими существующими алгоритмами прогнозирования нарушений.
Результаты
Результаты оценки DRaai-L и DRaai-S с использованием 10-кратных перекрестных проверочных тестов на DisProt3.6 и слепого теста на CASP7 представлены отдельно.
Производительность DRaai-L
Характеристики DRaai-L при разном количестве деревьев для модели случайного леса и различных значениях d для коэффициентов автокорреляции Моро-Брото представлены с использованием кривых ROC, показанных на рисунке.Площадь под ROC для модели, обученной с помощью 50 деревьев и коэффициентов автокорреляции, сгенерированных из d = 1, 2 ,, 30 а.о., составляет 85,1%. Даже для модели, обученной с 10 деревьями и коэффициентами автокорреляции, сгенерированными из d = 1, 2, …, 15 aa, площадь под ROC может достигать 82,7%. Этот результат лучше, чем результат тренировки с AAC (78,6%, менее 50 деревьев и d = 1, 2, …, 30) или RAAC (74,1%, менее 10 деревьев и d = 1, 2 ,. .., 15). Этот результат также лучше, чем у большинства других доступных алгоритмов, как показано отдельными точками на рисунке.
Производительность ДРАай-Л . Кривые ROC DRaai-L в 10-кратном перекрестном тесте. Все независимые точки на рисунке являются результатами, полученными от соответствующих онлайн-предикторов с их настройками по умолчанию.
Таблица описывает производительность DRaai-L в сравнении с другими опубликованными алгоритмами. Производительность измеряется с точки зрения чувствительности, точности, специфичности, S product , MCC и S w .DRaai-L — это 50 деревьев и d = 1, 2, …, 30. С этими шестью методами оценки производительность DRaai-L чуть ниже IUPred, но лучше, чем у большинства других предикторов.
Таблица 2
Производительность DRaai-L на DisProt3.6. Производительность DRaai-L в независимом тесте на 10% целей DisProt3.6 по различным параметрам по сравнению с другими предикторами.
Алгоритм | Чувствительность | Точность | Специфичность | S продукт | MCC | S w | |||||||
DisEMBL (катушка) | 0.71 | 0,33 | 0,43 | 0,31 | 0,13 | 0,24 | |||||||
DisEMBL (Rem465) | 0,36 | 0,67 | 0,93 | 0,33 | 0,93 | 0,33 901 ) | 0,42 | 0,41 | 0,77 | 0,32 | 0,18 | 0,19 | |
FoldIndex | 0,72 | 0,46 | 0,68 | 49 | 0,36 | 0,40 | |||||||
IUPred | 0,65 | 0,59 | 0,82 | 0,53 | 0,46 | 0,47 | |||||||
0,18 | 0,18 | ||||||||||||
PONDR (VL) | 0,55 | 0,55 | 0,77 | 0,42 | 0,32 | 0,29 | |||||||
0,45 | 0,70 | 0,44 | 0,30 | 0,33 | |||||||||
PONDR (XL) | 0,59 | 0,37 | 0,59 | 0,37 | 0,61 | 0,36 | 0,36 | 0,36 | 0,79 | 0,79 | 0,60 | 0,55 | 0,55 |
DRaai-L | 0,78 | 0,80 | 800,62 | 0,58 | 0,57 |
Производительность DRaai-S
На рисунке показаны кривые ROC для DRaai-S при 10-кратной перекрестной проверке целей 7 и CASP7. Площадь под ROC DRaai-S при 10-кратной перекрестной проверке составляет 81,2%, в то время как она упала до 72,2% при использовании для прогнозирования целей CASP7. В таблице описана производительность DRaai-S на CASP7 по сравнению с другими предикторами. DRaai-S имеет настройку из 10 деревьев и окна сглаживания 17 а.о.Результаты на рисунке и в таблице демонстрируют, что DRaai-S может достичь сопоставимого или даже более точного прогноза, чем некоторые опубликованные алгоритмы.
Производительность DRaai-S . Кривые ROC DRaai-S в 10-кратном перекрестном проверочном тесте и слепом тесте на CASP7. Все независимые точки на рисунке — это результаты для целей CASP7, полученные от соответствующих онлайн-предикторов с их настройками по умолчанию.
Таблица 3
Производительность DRaai-S на CASP7. Эффективность независимого теста DRaai-S на целях CASP7 по различным параметрам по сравнению с другими предикторами.
Алгоритм | Чувствительность | Прецизионность | Специфичность | Sproduct | MCC | Sw | |||||||
DisEMBL 9015 9015 9015 0,615 9015 9015 0,01 9015 9015 0152 9015 9015 0152 9015 | 0,15 | ||||||||||||
DisEMBL (Rem465) | 0,19 | 0,47 | 0,99 | 0,19 | 0,27 | 0,18 | |||||||
DisEMBL (Hot Loop) 0.41 | 0,12 | 0,81 | 0,33 | 0,12 | 0,21 | ||||||||
FoldIndex | 0,36 | 0,14 | 0,36 | 0,14 | 0,86 | 0,31 | 0,31 | 9015 | 0,96 | 0,21 | 0,21 | 0,19 | |
PONDR (CANXT) | 0,23 | 0,07 | 0,82 | 0,18 | 0.03 | 0,05 | |||||||
PONDR (VL) | 0,33 | 0,24 | 0,93 | 0,30 | 0,23 | 0,26 | 0,23 | 0,26 | |||||
PONDR6 | 0,14 | 0,25 | |||||||||||
PONDR (XL) | 0,30 | 0,06 | 0,72 | 0,22 | 0,01 | 0,02 | |||||||
VSL73 | 0,21 | 0,85 | 0,61 | 0,33 | 0,58 | ||||||||
DRaai-S | 0,55 | 0,55 | 0,14 9022 9022 9022 9020,34 |
Таким образом, при использовании простой информации AA-индекса и DRaai-L, и DRaai-S показали лучшую производительность, чем многие хорошо разработанные опубликованные алгоритмы.DRaai-L и DRaai-S могут быть дополнительно улучшены путем корректировки наборов AA-индексов, количества сглаживаемых остатков и количества остатков, учитываемых в функции автокорреляции.
Обсуждение
Хорошая производительность DRaai-L по сравнению с другими опубликованными алгоритмами, показанными на рисунке и в таблице, указывает на то, что непрерывные корреляции между соседними остатками вдоль первичной последовательности подразумевают упорядоченную / неупорядоченную структурную информацию. Хорошо известно, что остатки, входящие в упорядоченные структуры, всегда находятся рядом с другими остатками в пространстве.Другими словами, они ограничены взаимодействиями основной цепи или боковой цепи от других остатков, и, следовательно, они имеют более высокую плотность на карте контактов [27]. Действительно, функции автокорреляции, используемые в DRaai-L, отражают такую контактную информацию. Если остатки во фрагменте из более чем 30 аминокислотных остатков не обнаруживают какой-либо корреляции между собой, очень маловероятно, что эти остатки ограничены друг другом или образуют стабильные контакты, поэтому они имеют высокую склонность к нарушению порядка.
Результаты предсказания DRaai-S на DisProt3.6 и CASP7, показанные на рисунке и в таблице, показывают, что профили физико-химических свойств остатков, специфичные для положения, определяют, участвуют ли они в коротких неупорядоченных областях. Низкая производительность DRaai-S по сравнению с DRaai-L указывает на то, что точное прогнозирование коротких неупорядоченных областей значительно сложнее, чем прогнозирование длинных неупорядоченных областей. Частично это связано со сложностью извлечения информации о локальной последовательности, но, что более важно, с отсутствием достаточно надежных коротких неупорядоченных областей в наборе обучающих данных.Следовательно, предсказатель короткого DR, обученный из очень ограниченного числа коротких неупорядоченных областей, может давать высокую частоту ложных срабатываний или колеблющуюся точность предсказания.
CASP-мишени представляют собой типичный набор высокоупорядоченных глобулярных белков, которые подходят для определения структуры белков с помощью ЯМР или Х-кристаллографии. Таким образом, распределение нарушений в мишенях CASP не является типичным представлением нарушений во всех протеомах. Действительно, распределение коротких DR в DisProt3.6 существенно отличается. Среди ограниченного числа неупорядоченных областей в мишенях CASP большинство либо очень короткие, либо распределены в терминальных областях. Однако взаимосвязь между последовательностью белка и структурой в концевых областях не установлена [43]. В результате неупорядоченные области в мишенях CASP чрезвычайно трудно предсказать. Чтобы повысить точность прогнозирования целей CASP, многие существующие алгоритмы прогнозирования используют различные функции, включая прогнозируемую вторичную структуру и оценочную матрицу, зависящую от позиции, которая обычно требует длительного поиска PSI-BLAST.DRaai-S использует простую и единообразную информацию AA-индекса и может эффективно прогнозировать неупорядоченные области в целях CASP с разумной точностью, которая имеет большие перспективы для дальнейшего улучшения.
Заключение
Исследования белковых нарушений приобретают все большее значение, поскольку IUP являются обычными и функционально важными. Экспериментальные исследования IUPs дороги и требуют много времени. В этой статье мы представили два алгоритма DRaai-L и DRaai-S для прогнозирования неупорядоченных областей в белках с использованием профилей AA-индексов и модели машинного обучения случайного леса.Используя автокорреляционные функции Моро-Брото и профили AA-индексов и фильтр Савицки-Голея, длинные неупорядоченные области и короткие неупорядоченные области могут быть точно предсказаны с помощью DRaai-L и DRaai-S соответственно.
Благодаря простой и единообразной информации AA-индекса и DRaai-L, и DRaai-S превосходят некоторые хорошо разработанные алгоритмы с высокой вычислительной эффективностью. Это делает их конкурентоспособными инструментами для использования в крупномасштабных структурных анализах и сравнительных протеомных исследованиях.
Список использованных сокращений
а.о .: аминокислота; AAC: аминокислотный состав; AA-index: аминокислотный индекс; DR: неупорядоченная область; IDP: изначально неупорядоченный белок; IUP: внутренне неструктурированный белок; RAAC: уменьшенный аминокислотный состав; ROC: рабочая характеристика приемника.
Конкурирующие интересы
PH поддерживается Австралийской премией для аспирантов. XZ частично поддерживается грантом для начинающих исследователей RMIT. ZPF поддерживается премией APD от Австралийского исследовательского совета.
Вклад авторов
PH провела реализацию алгоритма и оценку производительности. XZ и ZPF участвовали в разработке исследования и составили рукопись.
Благодарности
Авторы благодарят доктора Марка Кортезе за его объяснение базы данных DisProt.
Эта статья была опубликована как часть BMC Bioinformatics Volume 10 Supplement 1, 2009: Proceedings of the Seventh Asia Pacific Bioinformatics Conference (APBC) 2009.Полное содержание приложения доступно на сайте http://www.biomedcentral.com/1471-2105/10?issue=S1
Ссылки
- Ward JJ, Sodhi JS, McGuffin LJ, Buxton BF, Jones DT. Прогнозирование и функциональный анализ нативного нарушения в белках трех царств жизни. J Mol Biol. 2004. 337: 635–645. DOI: 10.1016 / j.jmb.2004.02.002. [PubMed] [CrossRef] [Google Scholar]
- Ромеро П., Обрадович З., Ли Икс, Гарнер Е.К., Браун С.Дж., Дункер А.К. Сложность последовательности неупорядоченного белка.Белки. 2001; 42: 38–48. DOI: 10.1002 / 1097-0134 (20010101) 42: 1 <38 :: AID-PROT50> 3.0.CO; 2-3. [PubMed] [CrossRef] [Google Scholar]
- Coeytaux K, Poupon A. Прогнозирование развернутых сегментов в последовательности белка на основе аминокислотного состава. Биоинформатика. 2005; 21: 1891–1900. DOI: 10.1093 / биоинформатика / bti266. [PubMed] [CrossRef] [Google Scholar]
- Радивояц П., Обрадович З., Браун С.Дж., Дункер А.К. Предсказание границ между внутренне упорядоченными и неупорядоченными областями белка.Pac Symp Biocomput. 2003: 216–227. [PubMed] [Google Scholar]
- Weathers EA, Paulaitis ME, Woolf TB, Hoh JH. Сокращенного алфавита аминокислот достаточно для точного распознавания изначально неупорядоченного белка. FEBS Lett. 2004. 576: 348–352. DOI: 10.1016 / j.febslet.2004.09.036. [PubMed] [CrossRef] [Google Scholar]
- Хансен Дж. К., Лу Х, Росс Э. Д., Вуди Р. У. Внутреннее нарушение белков, аминокислотный состав и концевые домены гистонов. J Biol Chem. 2006; 281: 1853–1856. DOI: 10.1074 / JBC.R500022200. [PubMed] [CrossRef] [Google Scholar]
- Уверский В.Н., Олдфилд С.Дж., Дункер А.К. Показывает ваш ID. J Mol Recognit. 2005. 18: 343–84. DOI: 10.1002 / JMR.747. [PubMed] [CrossRef] [Google Scholar]
- Li X, Romero P, Rani M, Dunker AK, Obradovic Z. Прогнозирование нарушения белка для N-, C- и внутренних областей. Геномная информатика. 1999; 10: 30-40. [PubMed] [Google Scholar]
- Томсон Р., Эснуф Р. Прогнозирование естественных неупорядоченных областей в белках с использованием нейронной сети с био-базисной функцией.LNCS 3177. 2004. С. 108–116.
- Ян З. Р., Томсон Р., Макнил П., Эснуф Р. М.. RONN: метод нейронной сети с биоосновной функцией, применяемый для обнаружения изначально неупорядоченных областей в белках. Биоинформатика. 2005; 21: 3369–3376. DOI: 10.1093 / биоинформатика / bti534. [PubMed] [CrossRef] [Google Scholar]
- Obradovic Z, Peng K, Vucetic S, Radivojac P, Brown C, Dunker AK. Прогнозирование внутреннего нарушения по аминокислотной последовательности. Белки. 2003. 53: 566–572. DOI: 10.1002 / prot.10532.[PubMed] [CrossRef] [Google Scholar]
- Peng K, Vucetic S, Radivojac P, Brown CJ, Dunker AK, Obradovic Z. Оптимизация предикторов внутреннего расстройства с помощью информации об эволюции белков. J Bioinform Comp Biol. 2005; 3: 35–60. DOI: 10.1142 / S0219720005000886. [PubMed] [CrossRef] [Google Scholar]
- Лю Дж., Тан Х., Рост Б. Петлевые белки оказались консервативными в процессе эволюции. J Mol Biol. 2002. 322: 53–64. DOI: 10.1016 / S0022-2836 (02) 00736-2. [PubMed] [CrossRef] [Google Scholar]
- Лю Дж., Рост Б.NORSp: предсказания длинных регионов без регулярной вторичной структуры. Nucleic Acids Res. 2003; 31: 3833–3835. DOI: 10,1093 / нар / гкг515. [Бесплатная статья PMC] [PubMed] [CrossRef] [Google Scholar]
- Cheng J, Sweredoski M, Baldi P. Точное прогнозирование неупорядоченных областей белка путем анализа данных структуры белка. Интеллектуальный анализ данных и обнаружение знаний. 2005: 213–222. DOI: 10.1007 / s10618-005-0001-у. [CrossRef] [Google Scholar]
- Уорд Дж. Дж., Макгаффин Л. Дж., Брайсон К., Бакстон Б. Ф., Джонс Д. Т.. Сервер DISOPRED для прогнозирования белковых нарушений.Биоинформатика. 2004. 20: 2138–2139. DOI: 10.1093 / биоинформатика / bth295. [PubMed] [CrossRef] [Google Scholar]
- Джонс Д. Т., Уорд Дж. Дж. Прогнозирование неупорядоченных областей в белках с помощью матриц оценок для конкретных позиций. Белки. 2003. 53: 573–578. DOI: 10.1002 / prot.10528. [PubMed] [CrossRef] [Google Scholar]
- Линдинг Р., Дженсен Л.Дж., Диелла Ф., Борк П., Гибсон Т.Дж., Рассел Р.Б. Прогнозирование белковых нарушений: значение для структурной протеомики. Состав. 2003; 11: 1453–1459. DOI: 10.1016 / j.ул.2003.10.002. [PubMed] [CrossRef] [Google Scholar]
- Dosztanyi Z, Csizmok V, Tompa P, Simon I. Попарное содержание энергии, оцененное по аминокислотному составу, различает свернутые и внутренне неструктурированные белки. J Mol Biol. 2005; 347: 827–839. DOI: 10.1016 / j.jmb.2005.01.071. [PubMed] [CrossRef] [Google Scholar]
- Прогнозирование порядка / нарушения для белковых последовательностей http://www.sbc.su.se/~maccallr/disorder/
- Vullo A, Bortolami O, Pollastri G, Tosatto SCE.Spritz: сервер для предсказания изначально неупорядоченных областей в белковых последовательностях с использованием ядерных машин. Nucleic Acids Res. 2006; 34 [Бесплатная статья PMC] [PubMed] [Google Scholar]
- Su CT, Chen CY, Ou YY. Прогнозирование белковых нарушений с помощью сжатого PSSM с учетом склонности к порядку или беспорядку. BMC Bioinformatics. 2006; 7: 319. DOI: 10.1186 / 1471-2105-7-319. [Бесплатная статья PMC] [PubMed] [CrossRef] [Google Scholar]
- Obradovic Z, Peng K, Vucetic S, Radivojac P, Dunker AK.Использование свойств гетерогенной последовательности улучшает прогнозирование белкового нарушения. Белки. 2005. 61: 176–182. DOI: 10.1002 / prot.20735. [PubMed] [CrossRef] [Google Scholar]
- Peng K, Radivojac P, Vucetic S, Dunker AK, Obradovic Z. Зависимое от длины прогнозирование внутреннего нарушения белка. BMC Bioinformatics. 2006; 7: 208. DOI: 10.1186 / 1471-2105-7-208. [Бесплатная статья PMC] [PubMed] [CrossRef] [Google Scholar]
- Hirose S, Shimizu K, S. K, Y K, T. N POODLE-L: двухуровневая система предсказания SVM для надежного предсказания длинных неупорядоченных областей.Биоинформатика. 2007; 23: 2046–53. DOI: 10.1093 / биоинформатика / btm302. [PubMed] [CrossRef] [Google Scholar]
- Симидзу Кеа. POODLE-S: Веб-приложение для прогнозирования белковых нарушений с использованием физико-химических свойств и сокращенного набора аминокислот в позиционно-зависимой матрице оценок. Биоинформатика. 2007. 23: 2337–38. DOI: 10.1093 / биоинформатика / btm330. [PubMed] [CrossRef] [Google Scholar]
- Schlessinger A, Punta M, Rost B. Неструктурированные области белков, идентифицированные на основе предсказаний контактов.Биоинформатика. 2007. 23: 2376–2384. DOI: 10.1093 / биоинформатика / btm349. [PubMed] [CrossRef] [Google Scholar]
- Исида Т., Киношита К. PrDOS: прогнозирование неупорядоченных участков белка на основе аминокислотной последовательности. Исследования нуклеиновых кислот. 2007; 35: W460 – W464. DOI: 10,1093 / нар / гкм363. [Бесплатная статья PMC] [PubMed] [CrossRef] [Google Scholar]
- Исида Т., Киношита К. Прогнозирование неупорядоченных областей в белках на основе мета-подхода. Биоинформатика. 2008. 24: 1344–1348. DOI: 10.1093 / биоинформатика / btn195.[PubMed] [CrossRef] [Google Scholar]
- Peng K, Vucetic S, Radivojac P, Brown C, Dunker A, Obradovic Z. Оптимизация долгосрочных предикторов внутреннего расстройства с помощью информации об эволюции белков. J Bioinform Comp Biol. 2005; 3: 35–60. DOI: 10.1142 / S0219720005000886. [PubMed] [CrossRef] [Google Scholar]
- Брейман Л. Случайные леса. Машинное обучение. 2001; 45: 5–32. DOI: 10,1023 / А: 1010933404324. [CrossRef] [Google Scholar]
- Вучетик С., Обрадович З., Вакич В., Радивояк П., Пенг К., Якучева Л.М., Кортезе М.С., Лоусон Дж. Д., Браун С. Дж., Дж. Дж. Дж., Дж. Ньютон, Дункер А. К.DisProt: База данных о белковых нарушениях. Биоинформатика. 2005. 21: 137–140. DOI: 10.1093 / биоинформатика / bth576. [PubMed] [CrossRef] [Google Scholar]
- Hobohm U, Sander C. Расширенный репрезентативный набор белковых структур. Protein Sci. 1994; 3: 522. [Бесплатная статья PMC] [PubMed] [Google Scholar]
- Кавашима С., Покаровски П., Покаровска М., Колински А., Катаяма Т., Канехиса М. AAindex: база данных аминокислотных индексов, отчет о ходе работы за 2008 г. Исследование нуклеиновых кислот. 2008; 36: D202 – D205. DOI: 10.1093 / нар / гкм998. [Бесплатная статья PMC] [PubMed] [CrossRef] [Google Scholar]
- Шрайбер Т., Шмитц А. Суррогатный временной ряд. Physica. 2000; D142: 346. [Google Scholar]
- Дубчак И., Мучник И., мэр С., Дралюк И., Ким С. Распознавание белковой складки в контексте классификации структурной классификации белков (SCOP). Белки. 1999; 35: 401–407. DOI: 10.1002 / (SICI) 1097-0134 (199
) 35: 4 <401 :: AID-PROT3> 3.0.CO; 2-K. [PubMed] [CrossRef] [Google Scholar] - Фэн З.П., Чжан Коннектикут.Прогнозирование типов мембранных белков на основе индекса гидрофобности аминокислот. J. Protein Chem. 2000; 19: 269–275. DOI: 10,1023 / А: 10070394. [PubMed] [CrossRef] [Google Scholar]
- Цай Ч.З., Хан LY, Джи З.Л., Чен Ю.З. Классификация семейств ферментов машинами опорных векторов. Белки. 2004; 55: 66–76. DOI: 10.1002 / prot.20045. [PubMed] [CrossRef] [Google Scholar]
- Брейман Л. Технический отчет по случайным лесам для версии 3. 2001.
- Виттен И., Фрэнк Э. Интеллектуальный анализ данных: практические инструменты и методы машинного обучения.2. Издательство Морган Кауфманн; 2005. http://www.cs.waikato.ac.nz/ml/weka/ [Google Scholar]
- Jin Y, Dunbrack RLJ. Оценка прогнозов расстройства в CASP6. Белки. 2005. 61: 167–175. DOI: 10.1002 / prot.20734. [PubMed] [CrossRef] [Google Scholar]
- Хан П., Чжан Х, Нортон Р., Фэн З.П. Прогнозирование неупорядоченных областей в белках на основе деревьев решений с уменьшенным аминокислотным составом. J Comput Biol. 2006; 13: 1723–1734. DOI: 10.1089 / cmb.2006.13.1579. [PubMed] [CrossRef] [Google Scholar]
- Феррон Ф.Практический обзор методов прогнозирования белковых расстройств. Белки. 2006; 65: 1–14. DOI: 10.1002 / prot.21075. [PubMed] [CrossRef] [Google Scholar]
Межкластерная репликация | Руководство по Elasticsearch [7.13]
Межкластерная репликация
При кросс-кластерной репликации вы можете реплицировать индексы между кластерами на:
- Продолжать обработку поисковых запросов в случае выхода из строя центра обработки данных
- Предотвратить влияние объема поиска на пропускную способность индексирования
- Уменьшите задержку поиска за счет обработки поисковых запросов в географической близости к Пользователь
Межкластерная репликация использует активно-пассивную модель.Вы индексируете лидирующий индекс , а данные реплицируются в один или несколько индексов ведомого только для чтения. Прежде чем вы сможете добавить индекс ведомого в кластер, необходимо настроить удаленный кластер , который содержит индекс ведущего.
Когда ведущий индекс получает записи, ведомые индексы извлекают изменения из индекс лидера в удаленном кластере. Вы можете вручную создать подписчика индексы, или настроить шаблоны автосопровождения для автоматического создания подписчика индексы для индексов новых временных рядов.
Вы настраиваете кластеры кросс-кластерной репликации в однонаправленной или двунаправленной настройке:
- В однонаправленной конфигурации один кластер содержит только индексы лидера, а другой кластер содержит только индексы подчиненного.
- В двунаправленной конфигурации каждый кластер содержит как лидера, так и индексы последователей.
В однонаправленной конфигурации кластер, содержащий индексы ведомых должен использовать ту же или более новую версию Elasticsearch, что и удаленный кластер.Если новее, версии также должны быть совместимы, как показано в следующей таблице.
Матрица совместимости версийЛокальный кластер
Удаленный кластер
5,0 → 5,5
5,6
6,0 → 6,6
6,7
6,8
7.0
7.1 → 7.x
5,0 → 5,5
5,6
6.0 → 6,6
6,7
6.8
7,0
7,1 → 7.х
Многокластерная архитектураправить
Используйте кросс-кластерную репликацию для создания нескольких многокластерных архитектур в рамках Elastic Стек:
- Аварийное восстановление в случае отказа основного кластера, со вторичным кластером, служащим горячей резервной копией
- Местоположение данных для поддержки нескольких копий набор данных рядом с серверами приложений (и пользователями) и сокращает дорогостоящую задержку
- Централизованная отчетность для минимизации сети трафика и задержки при запросе нескольких географически распределенных кластеров Elasticsearch или для предотвращение воздействия поисковой нагрузки на индексацию путем передачи поисковой вторичный кластер
Посмотрите веб-семинар по кросс-кластерной репликации, чтобы узнать больше о следующих случаях использования.Затем настройте кросс-кластерную репликацию на локальном компьютере и приступайте к работе. через демонстрацию из вебинара.
Аварийное восстановление и высокая доступность
Аварийное восстановление предоставляет вашим критически важным приложениям устойчивость к сбоям в работе центра обработки данных или региона. Этот вариант использования наиболее распространенное развертывание кросс-кластерной репликации. Вы можете настроить кластеры в разных архитектуры для поддержки аварийного восстановления и высокой доступности:
Единый центр обработки данных аварийного восстановленияit
В этой конфигурации данные реплицируются из производственного центра обработки данных в центр обработки данных аварийного восстановления.Поскольку индексы последователя повторяют лидера index, ваше приложение может использовать центр обработки данных аварийного восстановления, если производственный центр обработки данных недоступен.
Несколько центров обработки данных для аварийного восстановленияправить
Вы можете реплицировать данные из одного центра обработки данных в несколько центров обработки данных. Этот конфигурация обеспечивает как аварийное восстановление, так и высокую доступность, гарантируя эти данные реплицируются в двух центрах обработки данных, если основной центр обработки данных не работает или недоступен.
На следующей диаграмме данные из Datacenter A реплицируются в Datacenter B и Datacenter C, у которых есть копия лидера, доступная только для чтения. индекс из Datacenter A.
Цепная репликация
Вы можете реплицировать данные в нескольких центрах обработки данных для создания репликации. цепь. На следующей диаграмме Datacenter A содержит индекс лидера. Datacenter B реплицирует данные из Datacenter A, а Datacenter C реплицирует из индексов последователей в Datacenter B. Связь между этими центры обработки данных образуют цепочку репликации.
Двунаправленная репликация
В настройке двунаправленной репликации все кластеры имеют доступ для просмотра все данные и все кластеры имеют индекс для записи без ручного реализация аварийного переключения.Приложения могут писать в локальный индекс в каждом центра обработки данных и считывать данные по нескольким индексам для глобального просмотра всех Информация.
Эта конфигурация не требует ручного вмешательства, когда кластер или центр обработки данных недоступен. На следующей диаграмме, если Datacenter A недоступен, вы можете продолжить использование Datacenter B без ручного переключения при отказе. Когда Datacenter A переходит в оперативный режим, возобновляется репликация между кластерами.
Эта конфигурация особенно полезна для рабочих нагрузок только с индексами, когда нет обновлений. для документирования значений происходят.В этой конфигурации документы, проиндексированные Elasticsearch, неизменный. Клиенты находятся в каждом центре обработки данных вместе с Elasticsearch. кластер и не взаимодействуют с кластерами в разных центрах обработки данных.
Местоположение данных Редактировать
Перенос данных ближе к пользователям или серверу приложений может уменьшить задержку и время отклика. Эта методология также применяется при репликации данных в Elasticsearch. Например, вы можете реплицировать каталог продуктов или эталонный набор данных на 20 или больше центров обработки данных по всему миру, чтобы минимизировать расстояние между данными и сервер приложений.
На следующей схеме данные реплицируются из одного центра обработки данных в три. дополнительные центры обработки данных, каждый в своем регионе. Центральный дата-центр содержит индекс лидера, а дополнительные центры обработки данных содержат подчиненного индексы, которые реплицируют данные в этом конкретном регионе. Эта конфигурация помещает данные ближе к приложению, обращающемуся к ним.
Централизованная отчетность
Использование кластера централизованной отчетности полезно при запросах по большой сеть неэффективна.В этой конфигурации вы реплицируете данные из многих кластеры меньшего размера в кластер централизованной отчетности.
Например, у крупного глобального банка может быть 100 кластеров Elasticsearch по всему миру. которые распределены по разным регионам для каждого отделения банка. С использованием кросс-кластерная репликация, банк может реплицировать события из всех 100 банков в центральный кластер, чтобы локально анализировать и агрегировать события для составления отчетов. Вместо того, чтобы поддерживать зеркальный кластер, банк может использовать кросс-кластерную репликацию для репликации определенных индексов.
На следующей диаграмме представлены данные из трех центров обработки данных в разных регионах. реплицируется в кластер централизованной отчетности. Эта конфигурация позволяет вам для копирования данных из региональных хабов в центральный кластер, где вы можете запускать все отчеты локально.
Механика репликацииправить
Несмотря на то, что вы настраиваете репликацию между кластерами на уровне индекса, Elasticsearch обеспечивает репликацию на уровне сегментов. Когда создается индекс последователей, каждый осколок в этом индексе извлекает изменения из соответствующего осколка в индекс лидера, что означает, что индекс последователя имеет такое же количество шарды в качестве индекса лидера.Все операции над лидером тиражируются последователь, например операции по созданию, обновлению или удалению документа. Эти запросы могут обслуживаться из любой копии ведущего шарда (основного или реплика).
Когда ведомый осколок отправляет запрос на чтение, ведущий осколок отвечает любые новые операции, ограниченные параметрами чтения, которые вы устанавливаете, когда настройка индекса последователей. Если новые операции недоступны, лидерный сегмент ожидает до настроенного тайм-аута для новых операций.Если истекает тайм-аут, лидерный сегмент отвечает на подчиненный сегмент, который находится там новых операций нет. Сопровождающий осколок обновляет статистику осколков и немедленно отправляет еще один запрос на чтение главному осколку. Этот модель связи гарантирует, что сетевые соединения между удаленными кластер и локальный кластер постоянно используются, избегая принудительного прекращение действия внешним источником, например брандмауэром.
Если запрос чтения не выполняется, выясняется причина сбоя. Если считается, что причина сбоя устранима (например, сеть сбой), ведомый осколок входит в цикл повтора.В противном случае последовательный сегмент приостанавливается пока вы не возобновите его.
Обработка обновленийправить
Вы не можете вручную изменить сопоставления или псевдонимы индекса подписчиков. Делать изменения, необходимо обновить индекс лидера. Поскольку они доступны только для чтения, последователь индексы отклоняют запись во всех конфигурациях.
Например, вы индексируете документ с именем
doc_1
в Datacenter A, который реплицируется в Datacenter B. Если клиент подключается к Datacenter B и пытается для обновленияdoc_1
запрос не выполняется.Для обновленияdoc_1
клиент должен подключитесь к Datacenter A и обновите документ в указателе лидера.Когда осколок ведомого получает операции от осколка лидера, он помещает те операции в буфере записи. Осколок подписчика отправляет массовую запись запросы с использованием операций из буфера записи. Если буфер записи превышает его настроенные ограничения, дополнительные запросы на чтение не отправляются. Эта конфигурация обеспечивает противодействие запросам на чтение, позволяя последующему сегменту для возобновления отправки запросов на чтение, когда буфер записи больше не заполнен.
Чтобы управлять репликацией операций из ведущего индекса, вы можете настроить параметры, когда создание индекса последователей.
Индекс последователя автоматически извлекает некоторые обновления, примененные к лидеру. index, в то время как другие обновления извлекаются по мере необходимости:
Тип обновления
Автомат
По необходимости
Псевдоним
Картография
Настройки
Например, изменение количества реплик в индексе лидера не реплицируется индексом последователя, поэтому этот параметр не может быть получен.
Если применить нединамическое изменение настроек к ведущему индексу, необходимо для индекса последователя, индекс подписчика закрывается, применяет настройки обновляются, а затем снова открывается сам. Индекс подписчиков недоступен для чтения и не может реплицировать записи во время этого цикла.
Инициализация последователей с помощью удаленного восстановления
Когда вы создаете индекс подписчиков, вы не можете использовать его, пока он не будет полностью инициализирован. Процесс удаленного восстановления создает новую копию осколка на ведомый узел путем копирования данных из первичного шарда в ведущем кластере.
Elasticsearch использует этот процесс удаленного восстановления для начальной загрузки индекса последователей с помощью данные из индекса лидера. Этот процесс предоставляет подписчику копию текущее состояние индекса лидера, даже если полная история изменений недоступен на лидере из-за слияния сегментов Lucene.
Удаленное восстановление — это интенсивный сетевой процесс, который передает все данные Lucene. сегментировать файлы от ведущего кластера до ведомого кластера. Последователь запрашивает инициирование сеанса восстановления на основном сегменте в лидер кластера.Затем последователь одновременно запрашивает фрагменты файлов из лидер. По умолчанию процесс одновременно запрашивает пять файлов размером 1 МБ. куски. Это поведение по умолчанию предназначено для поддержки лидера и последователя. кластеры с высокой сетевой задержкой между ними.
Вы можете изменять настройки динамического удаленного восстановления для ограничения скорости передаваемых данных и управления ресурсами, потребляемыми удаленными восстановление.
Используйте API восстановления в кластере, содержащем ведомого index для получения информации о выполняемом удаленном восстановлении.Потому что Elasticsearch реализует удаленное восстановление с помощью снимок и восстановление инфраструктуры, удаленный запуск восстановления помечены как тип
снимок
в API восстановления.Для репликации выноски требуется мягкое удалениеправить
Кросс-кластерная репликация работает путем воспроизведения истории отдельной записи операции, которые были выполнены с шардами индекса лидера. Elasticsearch необходимо сохранить история этих операций на лидере шарды, чтобы их могли тянуть задачи следующего шарда.Лежащий в основе Механизм, используемый для сохранения этих операций, — это мягкое удаление .
Мягкое удаление происходит всякий раз, когда существующий документ удаляется или обновляется. От сохранение этих мягких удалений до настраиваемых пределов, история операции могут быть сохранены на сегментах-лидерах и доступны для последовательный сегмент задач, поскольку он воспроизводит историю операций.
Индекс
.soft_deletes.retention_lease.period
параметр определяет максимальное время для сохранения аренды истории сегментов до того, как он будет считаться истекшим.Этот параметр определяет, как долго кластер содержащий ваш индекс подписчиков, может быть в автономном режиме, который по умолчанию составляет 12 часов. Если копия осколка восстанавливается по истечении срока аренды, но отсутствующая операции по-прежнему доступны в индексе лидера, тогда Elasticsearch установит новый договор аренды и скопируйте недостающие операции. Однако Elasticsearch не гарантирует сохраняют невыполненные операции, поэтому также возможно, что некоторые из недостающих операции были исключены лидером и теперь полностью недоступен.Если это произойдет, то последователь не сможет восстановиться автоматически, поэтому вы должны воссоздать это.Мягкое удаление должно быть включено для индексов, которые вы хотите использовать в качестве лидера. индексы. Мягкое удаление включено по умолчанию для новых индексов, созданных на или после Elasticsearch 7.0.0.
Кросс-кластерная репликация не может использоваться для существующих индексов, созданных с помощью Elasticsearch 7.0.0 или более ранней версии, где мягкое удаление отключено. Ты должен переиндексируйте ваши данные в новый индекс с мягким удалением включено.
Использовать кросс-кластерную репликацию
В следующих разделах представлена дополнительная информация о том, как настроить и использовать кросс-кластерную репликацию:
Создание снимков индекса в Amazon Elasticsearch Service
снимков в Amazon Elasticsearch Service (Amazon ES) — это резервные копии индексов кластера. и состояние. Состояние включает настройки кластера, информацию об узле, индекс настройки и выделение сегментов.
Снимки состояния Amazon ES бывают следующих форм:
Автоматические снимки только для кластера восстановление.Вы можете использовать их для восстановления вашего домена в случае красного статуса кластера или потеря данных. Для получения дополнительной информации см. Восстановление снимков ниже. Amazon ES сохраняет автоматические снимки состояния в предварительно настроенной корзине Amazon S3 без дополнительных затрат. заряжать.
Снимки вручную предназначены для восстановления кластера или для перемещения данных из одного кластера в Другой.Вы должны инициировать создание снимков вручную. Эти снимки хранятся в вашем Собственная корзина Amazon S3 и стандартная плата за S3. Если у вас есть снимок с самоуправляемый кластер Elasticsearch, вы можете использовать этот моментальный снимок для миграции на Amazon ES домен. Для получения дополнительной информации см. Переход на Amazon Elasticsearch Service.
Все домены Amazon ES делают автоматические снимки состояния, но частота отличается следующим: способы:
Для доменов с Elasticsearch 5.3 и более поздних версий Amazon ES требует почасовой автоматизации снимки и хранит до 336 из них в течение 14 дней.
Для доменов с Elasticsearch 5.1 и более ранних версий Amazon ES выполняет ежедневную автоматизацию снимки в течение указанного вами часа, сохраняет до 14 из них и не сохраняет любые снимки данных за более чем 30 дней.
Если ваш кластер переходит в красный статус, все автоматические снимки не работают, а кластер статус сохраняется.Если вы не исправите проблему в течение двух недель, вы можете навсегда потерять в данные в вашем кластере. Инструкции по устранению неполадок см. В разделе Состояние красного кластера.
Предпосылки
Для создания снимков вручную необходимо работать с IAM и Amazon S3.Убедись, что ты встретиться следующие предварительные условия перед попыткой сделать снимок:
Необходимое условие Описание Ковш S3 Создайте корзину S3 для хранения снимков вручную для вашего домена Amazon ES.Для получения инструкций, видеть Создайте корзину в Руководстве по началу работы с Amazon Simple Storage Service .
Запомните название ведра, чтобы использовать его в следующих места:
Не применяйте правило жизненного цикла S3 Glacier к этому сегменту.Снимки вручную не поддерживаются ледник S3 класс хранения.
Роль IAM Создайте роль IAM для делегирования разрешений Amazon ES.Инструкции см. В разделе Создание роли IAM (консоли) в Руководстве пользователя IAM . Остальное В главе эта роль называется
TheSnapshotRole
.Прикрепите политику IAM
Прикрепите следующую политику к
TheSnapshotRole
к разрешить доступ к ведру S3:{ «Версия»: «2012-10-17», "Заявление": [{ "Действие": [ "s3: ListBucket" ], «Эффект»: «Разрешить», «Ресурс»: [ "arn: aws: s3 :::
s3-bucket-name
" ] }, { "Действие": [ "s3: GetObject", "s3: PutObject", "s3: DeleteObject" ], «Эффект»: «Разрешить», «Ресурс»: [ "arn: aws: s3 :::s3-bucket-name
/ *" ] } ] }Инструкции по присоединению политики к роли см. В разделе «Добавление разрешений для идентификации IAM» в руководстве пользователя IAM .
Изменить траст отношения
Измените доверительные отношения
TheSnapshotRole
на укажите Amazon ES в выпискеPrincipal
, как показано на следующий пример:{ «Версия»: «2012-10-17», "Заявление": [{ "Сид": "", «Эффект»: «Разрешить», "Главный": { «Сервис»: «es.amazonaws.com " }, «Действие»: «sts: AssumeRole» }] }
Инструкции по редактированию доверительных отношений см. В разделе «Изменение политики доверия ролей» в Руководстве пользователя IAM .
Разрешения Чтобы зарегистрировать хранилище снимков, вам необходимо иметь возможность для передачи
TheSnapshotRole
Amazon ES.Вам также нужен доступ кes: ESHttpPut
action. Чтобы предоставить оба этих разрешения, прикрепите следующую политику к пользователю или роли IAM чьи учетные данные используются для подписи запроса:{ «Версия»: «2012-10-17», "Заявление": [ { «Эффект»: «Разрешить», "Действие": "iam: PassRole", "Ресурс": "arn: aws: iam ::
123456789012
: роль /TheSnapshotRole
" }, { «Эффект»: «Разрешить», "Действие": "es: ESHttpPut", "Ресурс": "arn: aws: es:регион
:123456789012
: домен /имя-домена
/ *" } ] }Если у вашего пользователя или роли нет
iam: PassRole
разрешения на прохождение ролиTheSnapshotRole
, с которыми вы можете столкнуться следующая распространенная ошибка при попытке зарегистрировать репозиторий в следующий шаг:$ регистр-репозиторий python.ру {"Сообщение": "Пользователь: arn: aws: iam ::
123456789012
: пользователь /MyUserAccount
не авторизован для выполнения: iam: PassRole на ресурсе: arn: aws: iam ::123456789012
: role /TheSnapshotRole
"}Регистрация руководства хранилище снимков
Вам необходимо зарегистрировать репозиторий моментальных снимков в Amazon ES, прежде чем вы сможете индексировать снимки.Эта разовая операция требует, чтобы вы подписали свой запрос AWS с учетные данные, которым разрешен доступ к
TheSnapshotRole
, как описано в Предпосылки.Шаг 1. Сопоставьте роль снимка в Kibana (при использовании детального контроля доступа)
Детальный контроль доступа вводит дополнительный шаг при регистрации репозиторий.Даже если вы используете базовую аутентификацию HTTP для всех других целей, вы необходимо сопоставить роль
manage_snapshots
вашему пользователю или роли IAM, имеетiam: PassRole
разрешений для передачиРоль Снимков
.Перейдите к плагину Kibana для своего домена Amazon ES.Вы можете найти Конечная точка Kibana на панели управления вашего домена на консоли Amazon ES.
В главном меню выберите Безопасность , Роли и выберите manage_snapshots роль.
Выберите Сопоставленные пользователи , Управление сопоставлением .
Добавьте домен ARN пользователя или роли, у которой есть разрешения на передачу
Роль Снимков
.Поместите пользовательские ARN в Пользователи и роли ARN под Backend Роль .arn: aws: iam ::
123456789123
: пользователь /имя пользователя
arn: aws: iam ::
123456789123
: роль /имя-роли
Выберите Карта и подтвердите пользователя или роль отображается под Сопоставленные пользователи .
Шаг 2: Зарегистрируйте репозиторий
Чтобы зарегистрировать репозиторий моментальных снимков, отправьте запрос PUT в конечную точку домена Amazon ES.Ты не может использовать
curl
для выполнения этой операции, потому что он не поддерживает AWS подписание запроса. Вместо этого используйте образец клиента Python, Почтальон, или другой способ отправить подписанный запрос на регистрацию хранилище снимков.Запрос имеет следующий формат:
PUT
elasticsearch-domain-endpoint
/ _snapshot /имя-моментального снимка-репо
{ "тип": "s3", "настройки": { "bucket": "s3-bucket-name
", «регион»: «район
», "role_arn": "arn: aws: iam ::123456789012
: role /TheSnapshotRole
" } }Если ваш домен находится в виртуальном частном облаке (VPC), ваш компьютер должен быть подключен к VPC для запроса на успешную регистрацию снимка репозиторий.Доступ к VPC зависит от конфигурации сети, но, вероятно, включает подключение к VPN или корпоративной сети. Чтобы убедиться, что вы можете связаться с Amazon ES домен, перейдите к
https: //
в веб-браузере и убедитесь, что вы получили ответ JSON по умолчанию.ваш-vpc-домен
.регион
.es.amazonaws.comШифрование снимка репозитории
В настоящее время вы не можете использовать главные ключи службы управления ключами (KMS) для шифрования. снимки вручную, но вы можете защитить их, используя шифрование на стороне сервера (SSE).
Чтобы включить SSE с ключами, управляемыми S3, для сегмента, который вы используете в качестве моментального снимка репозиторий, добавьте
"server_side_encryption": true
в«настройки»
блок запроса PUT. Для получения дополнительной информации см. Защита данных использование серверного шифрования с ключами шифрования, управляемыми Amazon S3 в Amazon Simple Storage Service User Руководство .В качестве альтернативы вы можете использовать главные ключи клиента (CMK) на стороне сервера. шифрование в корзине S3, которую вы используете в качестве хранилища моментальных снимков.
Перенос данных в другой домен
Регистрация репозитория моментальных снимков является одноразовой операцией.Однако для перехода с один домен в другой, вы должны зарегистрировать тот же репозиторий снимков на старый домен и новый домен. Имя репозитория произвольное.
При переходе на новый домен или регистрация одного и того же репозитория с несколькими доменами по другой причине:
При регистрации репозитория на новом домене добавить
"только для чтения": true
для"настройки" блока
запроса PUT.Этот параметр предотвращает случайное перезапись данных из старого домена.Если вы переносите данные в домен в другом регионе, (для Например, со старого домена и корзины, расположенной в us-east-2, на новый домен в us-west-2), вы можете увидеть эту ошибку 500 при отправке PUT запрос:
Ковш находится в этом регионе: us-east-2.Используйте этот регион, чтобы повторить запрос.
Если вы столкнулись с этой ошибкой, попробуйте заменить
«регион»: "us-east-2"
с"endpoint": "s3.amazonaws.com"
в операторе PUT и повторите запрос.
Использование образца Python клиент
Клиент Python легче автоматизировать, чем простой HTTP-запрос, и он лучше возможность многократного использования.Если вы решите использовать этот метод для регистрации репозитория моментальных снимков, сохраните следующий пример кода Python как файл Python, например
register-repo.py
. Клиенту требуется AWS SDK для Python (Boto3), запросы и запросы-aws4auth пакеты. Клиент содержит закомментированные примеры для другого снимка. операции.Обновите следующие переменные в примере кода:
host
,область
,путь
иполезная нагрузка
.импорт boto3 запросы на импорт from requests_aws4auth импортировать AWS4Auth host = '' # включить https: // и конечный / region = '' # например, us-west-1 service = 'es' учетные данные = boto3.Session (). get_credentials () awsauth = AWS4Auth (credentials.access_key, credentials.secret_key, регион, служба, session_token = credentials.token) # Зарегистрировать репозиторий path = '_snapshot /
my-snapshot-repo-name
' # конечная точка API Elasticsearch url = хост + путь payload = { "тип": "s3", "настройки": { "bucket": "s3-bucket-name
", «регион»: «сша-запад-1
», "role_arn": "arn: aws: iam ::123456789012
: role /TheSnapshotRole
" } } заголовки = {"Content-Type": "application / json"} r = запросы.положить (url, auth = awsauth, json = payload, headers = headers) печать (r.status_code) печать (r.text) # # Моментальный снимок # # путь = '_snapshot / мой-снимок-репо / мой-снимок' # url = host + path # # r = requests.put (url, auth = awsauth) # # печать (r.text) # # # Удалить индекс # # путь = 'мой-индекс' # url = host + path # # r = requests.delete (url, auth = awsauth) # # печать (r.text) # # # Восстановить снимок (все индексы, кроме Kibana и детального контроля доступа) # # путь = '_snapshot / мой-снимок-репо / мой-снимок / _restore' # url = host + path # # payload = { # "индексы": "-.kibana *, -. opendistro_security ", # "include_global_state": ложь #} # # headers = {"Content-Type": "application / json"} # # r = requests.post (url, auth = awsauth, json = payload, headers = заголовки) # # печать (r.text) # # # Восстановить снимок (один индекс) # # путь = '_snapshot / мой-снимок-репо / мой-снимок / _restore' # url = host + path # # payload = {"индексы": "мой-индекс"} # # headers = {"Content-Type": "application / json"} # # r = requests.post (url, auth = awsauth, json = payload, headers = заголовки) # # печать (r.текст)Создание снимков вручную
Снимки не делаются мгновенно. Они требуют времени для завершения и не представляют идеальные виды кластера на определенный момент времени. Пока создается снимок, вы можете по-прежнему индексировать документы и делать другие запросы к кластеру, но новые документы и обновления существующих документов обычно не включаются в снимок.Снимок включает первичные осколки в том виде, в котором они существовали, когда Elasticsearch инициировал моментальный снимок. В зависимости от в зависимости от размера пула потоков моментальных снимков в снимок в несколько разное время.
Хранение снимков и представление
Моментальные снимки Elasticsearch являются инкрементными, то есть в них хранятся только измененные данные. поскольку последний удачный снимок.Этот инкрементный характер означает разницу в дисках использование между частыми и редкими снимками часто минимально. Другими словами, создание ежечасных снимков в течение недели (всего 168 снимков) может не потребовать много больше места на диске, чем при создании одного снимка в конце недели. Кроме того, чем больше чем чаще вы делаете снимки, тем меньше времени требуется на их создание.Немного Elasticsearch пользователи делают снимки каждые полчаса.
Создать снимок
При создании снимка вы указываете следующую информацию:
Примеры в этой главе используют curl, a обычный HTTP-клиент, для удобства и краткости.Однако, если ваша политика доступа укажите пользователей или роли IAM, вы должны подписать запросы на создание снимков. Вы можете использовать закомментированные примеры в образце клиента Python для делать подписанные HTTP-запросы к тем же конечным точкам, которые используют команды curl.
Чтобы сделать снимок вручную, выполните следующие действия:
Вы не можете сделать снимок, если он сейчас выполняется.Чтобы проверить, запустите следующая команда:
curl -XGET '
elasticsearch-domain-endpoint
/ _snapshot / _status'Выполните следующую команду, чтобы сделать снимок вручную:
curl -XPUT '
elasticsearch-domain-endpoint
/ _snapshot /имя-репозитория
/имя-снимка
'
Время, необходимое для создания моментального снимка, увеличивается с размером домена Amazon ES.При длительных операциях создания моментальных снимков иногда возникает следующая ошибка:
504 GATEWAY_TIMEOUT
. Обычно вы можете игнорировать эти ошибки и дождитесь успешного завершения операции. Выполните следующую команду, чтобы проверьте состояние всех снимков вашего домена:curl -XGET '
elasticsearch-domain-endpoint
/ _snapshot /имя-репозитория
/ _all? Pretty'Восстановление снимков
Если вы используете псевдонимы индекса, прекратите запросы на запись к псевдониму или переключите псевдоним на другой индекс перед удалением его индекса.Остановка запросов на запись помогает избежать следующий сценарий:
Вы удаляете индекс, при этом удаляется его псевдоним.
Ошибочный запрос на запись в теперь удаленный псевдоним создает новый индекс с тем же именем, что и псевдоним.
Вы больше не можете использовать псевдоним из-за конфликта имен с новым индекс.
Если вы переключили псевдоним на другой индекс, укажите
"include_aliases": false
при восстановлении из снимок.Чтобы восстановить снимок, выполните следующие действия:
Определите снимок, который вы хотите восстановить.Чтобы увидеть все хранилища снимков, выполните следующую команду:
curl -XGET '
elasticsearch-domain-endpoint
/ _snapshot? Довольно'После идентификации репозитория выполните следующую команду, чтобы увидеть все снимки:
curl -XGET '
elasticsearch-domain-endpoint
/ _snapshot /имя-репозитория
/ _all? Pretty'Большинство автоматических снимков хранятся в
cs-automatic
репозиторий.Если ваш домен шифрует данные в состоянии покоя, они хранятся вcs-automatic-enc
репозиторий. Если вы не видите руководство репозиторий снимков, который вы ищете, убедитесь, что вы зарегистрировались это в домен.(Необязательно) Удалите или переименуйте один или несколько индексов в домене Amazon ES, если у вас есть конфликты именования между индексами в кластере и индексами в снимке.Ты не может восстановить моментальный снимок ваших индексов в кластере Elasticsearch, который уже содержит индексы с такими же именами.
У вас есть следующие возможности, если у вас есть конфликты именования индексов:
Следующая команда удаляет все существующие индексы в домене:
curl -XDELETE '
elasticsearch-domain-endpoint
/ _all'Однако, если вы не планируете восстанавливать все индексы, вы можете просто удалить один:
curl -XDELETE '
elasticsearch-domain-endpoint
/имя-индекса
'Чтобы восстановить снимок, выполните следующую команду:
curl -XPOST '
elasticsearch-domain-endpoint
/ _snapshot /имя-репозитория
/имя-снимка
/ _restore'Из-за специальных разрешений на Kibana и детального контроля доступа индексы, попытки восстановить все индексы могут потерпеть неудачу, особенно если вы попытаетесь восстановить из автоматического снимка.В следующем примере восстанавливается только один index,
my-index
, из2020-снимок
вcs-automatic
репозиторий снимков:curl -XPOST '
elasticsearch-domain-endpoint
/ _snapshot / cs-automatic / 2020-snapshot / _restore' -d '{"index": "my-index"}' -H 'Content-Type: application / json 'В качестве альтернативы вы можете восстановить все индексы , кроме Kibana и детального контроля доступа. индексы:
curl -XPOST '
elasticsearch-domain-endpoint
/ _snapshot / cs-automatic / 2020-snapshot / _restore' -d '{"индексы": "-.kibana *, -. opendistro_security "} '-H' Content-Type: application / json '
Если не все первичные сегменты были доступны для задействованных индексов, снимок может иметь состояние
ЧАСТИЧНО
.Это значение указывает на то, что данные хотя бы из одного осколка не удалось сохранить. Вы все еще можете восстановить из частичный снимок, но вам может потребоваться использовать старые снимки, чтобы восстановить любые отсутствующие индексы.Удаление снимков вручную
Чтобы удалить снимок, сделанный вручную, выполните следующую команду:
УДАЛИТЬ _snapshot /
имя-репозитория
/имя-снимка
Автоматизация снимков с помощью состояния индекса Управление
Вы можете использовать операцию «Управление состоянием индекса» (ISM)
снимок
, чтобы автоматически запускать снимки индексов. в зависимости от возраста, размера или количества документов.Для примера политики ISM используя операцию снимкаИспользование куратора для снимков
Некоторые пользователи находят такие инструменты, как Curator, удобными для управления индексами и снимками.Использовать пункт для установки Куратор:
pip install elasticsearch-curator
Curator предлагает расширенные функции фильтрации, которые могут помочь упростить управление задачи на сложных кластерах. Amazon ES поддерживает Curator в доменах с Elasticsearch версия 5.1 и выше. Вы можете использовать Curator как интерфейс командной строки (CLI) или Python API. Если вы используете CLI, экспортируете свои учетные данные в командной строке и настраиваете
curator.yml
следующим образом:клиент: хосты: поиск-
мой-домен
.us-west-1
.es.amazonaws.com порт: 443 use_ssl: Верно aws_region:us-west-1
aws_sign_request: Верно ssl_no_validate: Ложь тайм-аут: 60 Ведение журнала: loglevel: ИНФОРМАЦИЯПримеры лямбда-функций, использующих Python API, см. В разделе Использование Curator для ротации данных в Amazon Elasticsearch Service.
Определение MSCI
Что такое MSCI?
MSCI — это аббревиатура от Morgan Stanley Capital International. Это инвестиционная исследовательская компания, которая предоставляет институциональным инвесторам и хедж-фондам фондовые индексы, аналитику рисков и показателей портфеля, а также инструменты управления. MSCI, пожалуй, наиболее известен своими эталонными индексами, включая MSCI Emerging Market Index и MSCI Frontier Markets Index, которыми управляет MSCI Barra.Компания продолжает запускать новые индексы каждый год.
Ключевые выводы
- MSCI предоставляет инвесторам инвестиционные данные и аналитические услуги.
- MSCI была образована, когда Morgan Stanley купила лицензионные права на данные Captial International в 1986 году.
- Фирма, пожалуй, наиболее известна своей серией фондовых индексов, которые используются многими паевыми фондами и ETF в качестве ориентира.
Понимание MSCI
Capital International представила в 1969 году ряд фондовых индексов, отражающих международные рынки, — первые индексы мировых фондовых рынков для рынков за пределами Соединенных Штатов.Когда Morgan Stanley купил лицензионные права на данные Capital в 1986 году, он начал использовать аббревиатуру MSCI, и Morgan Stanley стал ее крупнейшим акционером. В 2004 году MSCI приобрела Barra, фирму по управлению рисками и аналитике портфеля, примерно за 816,4 миллиона долларов. В результате слияния обеих компаний была создана новая фирма, MSCI Barra, которая была выделена в ходе первичного публичного предложения (IPO) в 2007 году и начала торговаться на Нью-Йоркской фондовой бирже (NYSE) под биржевым тикером MSCI. В 2009 году фирма стала полностью независимой, обособленной публичной компанией.
Фирма предоставляет своим клиентам инвестиционные инструменты от Barra, Financial Engineering Associates, RiskMetrics, Institutional Shareholder Services, Measurisk и Центра финансовых исследований и анализа. Он также публикует индексы, которые широко доступны для инвесторов.
MSCI, пожалуй, наиболее известен своими фондовыми индексами — более 160 000, которые сосредоточены на различных географических регионах и типах акций, таких как акции с малой, средней и большой капитализацией. Они отслеживают эффективность акций, которые в них включены, и служат основой для биржевых фондов (ETF).По состоянию на 30 июня 2019 года активы под управлением (AUM) составляли 12,3 триллиона долларов, сопоставленные с индексами компании. Лучшие индексы MSCI:
- MSCI Emerging Market Index: запущенный в 1988 году, этот индекс включает участников из 24 стран с развивающейся экономикой, включая Китай, Индию, Таиланд, Бразилию, Южную Африку, Россию и Мексику.
- MSCI Frontier Markets Index: используемый в качестве эталона для измерения эффективности финансовых рынков в некоторых странах Азии, этот индекс фокусируется на 28 рынках Ближнего Востока, Африки, Южной Америки и Европы.Некоторые из приграничных регионов, акции которых включены в этот индекс, — это Кувейт, Вьетнам, Марокко, Ливан, Кения и Бахрейн.
- MSCI All Country World Index (ACWI): это флагманский глобальный индекс акций компании, который отслеживает динамику акций компаний с малой и большой капитализацией на 23 развитых и 26 развивающихся рынках, где представлено более 3000 акций.
- Индекс MSCI EAFE: Индекс EAFE включает 918 акций из 21 развитой рыночной страны, за исключением Канады и США.
Особые соображения
Индексы MSCI — это индексы, взвешенные по рыночной капитализации, что означает, что акции взвешиваются в соответствии с их рыночной капитализацией, рассчитываемой как цена акции, умноженная на общее количество акций в обращении. Акции с наибольшей рыночной капитализацией получают наибольший вес в индексе. Это отражает тот факт, что компании с большой капитализацией оказывают большее влияние на экономику, чем компании со средней или малой капитализацией. Процентное изменение цены акций с большой капитализацией в индексе MSCI приведет к большему изменению индекса, чем изменение цены компании с малой капитализацией.
ИндексыMSCI пересматриваются ежеквартально и дважды в год ребалансируются.
Каждый индекс в семействе MSCI пересматривается ежеквартально и дважды в год балансируется. Акции добавляются или удаляются из индекса аналитиками MSCI, чтобы гарантировать, что индекс по-прежнему действует как эффективный эталон акций для рынка, который он представляет. Когда происходит ребалансировка индекса MSCI, ETF и паевые инвестиционные фонды также должны корректировать свои фонды, поскольку они созданы для отражения показателей индексов.
Есть ли место для дальнейшего падения индекса Nifty Auto?
Индекс Nifty Auto упал почти на 18% с апреля, что примерно в три раза превышает падение индекса Nifty 100. Помимо слабой квартальной прибыли в июне, неопределенность спроса и общее замедление роста экономики поставили инвесторов в тупик.
Среди автомобильных запасов больше всего пострадали акции производителей оригинального оборудования (OEM), что свидетельствует о серьезном стрессе в продажах автомобилей.Неудивительно, что результаты июньского квартала были жалкими, поскольку двузначное снижение продаж и отрицательная операционная долговая нагрузка сказались на рентабельности.
Ситуацию усугубляет продолжающийся спад продаж автомобилей, который вселяет надежду на какое-либо оживление в текущем квартале.
Согласно данным, опубликованным Обществом индийских автопроизводителей (Сиам), для индустрии легковых автомобилей в Индии это был худший июль почти за 19 лет: в прошлом месяце продажи упали на 31% до 200 790 автомобилей.Это были худшие показатели продаж с момента падения на 35% в декабре 2000 года.
Наиболее резкое падение продаж наблюдалось в сегменте коммерческих автомобилей, поскольку пересмотр норм нагрузки на ось и сокращение грузовых перевозок из-за экономического спада работали в тандеме, чтобы снизить продажи грузовиков. Не лучше обстоят дела с продажами автомобилей и двухколесных транспортных средств, а спрос как в сельских, так и в городских районах остается низким, что приводит к увеличению товарных запасов. Сокращение производства, вероятно, продолжится, что может привести к еще большей потере рабочих мест в промышленности и смежном секторе.
Но спорный вопрос, ожидает ли инвесторов больше боли.
Часы: Расшифровка краха автомобильного сектора: причины, последствия и путь вперед
Индекс Nifty Auto упал на 36% примерно за год. Согласно отчету Jefferies India Pvt Ltd, «коррекция автомобильных запасов с декабря 2017 года состояла из двух частей. Первые шесть-десять месяцев были вызваны понижением оценки, в то время как в последние девять-двенадцать месяцев снижение прибыли стало ключевым фактором коррекции.«
С точки зрения оценки не похоже, что автомобильные акции упали в пропасть. Действительно, годовой форвардный коэффициент отношения цены к прибыли автомобильного индекса Nifty снизился с 16,4 раза 1 апреля до 15,3 раза 13 августа, но остается намного выше десятилетнего минимума в 8,3 раза, достигнутого 1 июня 2012 года.
Помимо этого, комментарии руководства большинства фирм указывают на задержку восстановления по сравнению с более ранними прогнозами, что во втором полугодии дела обстоят лучше.«Таким образом, над автомобильным сектором нависает риск дальнейшего снижения оценок прибыли как на 20, так и на 21 финансовый год. Это создает веские основания для дальнейшего снижения цен на акции «, — говорит Бхарат Джанани, аналитик Sharekhan.
Подпишитесь на информационный бюллетень монетного двора
* Введите действующий адрес электронной почты
* Спасибо за подписку на нашу рассылку.
Не пропустите ни одной истории! Оставайтесь на связи и в курсе с Mint. Скачать наше приложение сейчас !!
ТемыОценка зон скопления и индексов времени в пути на основе данных плавающего вагона
Основные моменты
- •
Автоматическое определение границ зон скопления на макроуровне
- •
Пространственно-временной анализ зон скопления ‘ закономерности в разные сезоны
- •
Оценка индексов времени в пути для уменьшения объема трафика
- •
Применение зон загруженности и индексов времени в пути в логистических операциях
- •
Подтверждение результатов с помощью полевых испытаний
Abstract
Эффективное прогнозирование транспортных заторов приносит пользу различным участникам дорожного движения, от обычных пассажиров и операторов логистики до градостроителей и ответственных органов власти.Это исследование направлено на предоставление высококачественной оценки условий движения на основе больших исторических данных о плавающих автомобилях (FCD) с двумя основными целями: (i) оценка зон заторов на большой дорожной сети и (ii) оценка времени в пути в пределах зоны скопления в форме изменяющихся во времени индексов времени в пути (TTI). На микроуровне условия движения в виде профилей скорости были сопоставлены со звеньями в дорожной сети. На макроуровне наблюдаемая область была разделена на мелкозернистую сетку и представлена в виде изображения, где каждый пиксель указывает интенсивность скопления.Пространственно-временные характеристики зон скопления определялись с помощью операции морфологического закрытия и моделирования Монте-Карло в сочетании с временной кластеризацией. В качестве примера была выбрана дорожная сеть в Хорватии с пространственно-временным анализом, дифференцирующим летний сезон и остальное время года. Для проверки предложенного подхода было проведено три сравнения: (i) сравнение с реальным временем прохождения маршрутов, управляемым контролируемым образом, (ii) сравнение с историческим набором данных траектории, и (iii) сравнение с современными данными. метод.По сравнению с реальным измеренным временем в пути, использование изменяющихся во времени TTI для оценки времени в пути привело к средней относительной процентной ошибке 4,13% с незначительной разницей в оценках времени в пути на микроуровне и значительным улучшением по сравнению с текущим. Хорватское промышленное судоходство. Результаты подтверждают выполнимость оценки зон заторов и изменяющихся во времени TTI на большой дорожной сети из FCD с применением в городском планировании и операциях по зависящей от времени маршрутизации благодаря: значительному сокращению объема данных без заметной потери качества и значимости сокращение времени вычислений предварительной обработки.
Ключевые слова
Данные о плавающих автомобилях
Профили скорости
Зоны скопления
Изменяющиеся во времени индексы времени в пути
Рекомендуемые статьиЦитирующие статьи (0)
© 2021 Авторы. Опубликовано Elsevier Ltd.
Рекомендуемые статьи
Цитирование статей
Еженедельный обзор мировых рынков | T. Rowe Price
В неспокойную неделю индекс Shanghai Composite и индекс CSI 300 выросли на 0,4% и 0,5% соответственно.Рынки показали облегчение после того, как отчет Китая по валовому внутреннему продукту (ВВП) за второй квартал в четверг оказался в соответствии с ожиданиями. Приток акций в Китай через канал Stock Connect стал положительным после выхода данных по ВВП, с самым высоким дневным притоком с сентября, сообщает азиатский торговый отдел T. Rowe Price. По словам трейдеров, иностранные инвесторы покупали технологические, финансовые и потребительские акции с прочными фундаментальными показателями, избегая дорогостоящих тематических игр, таких как электромобили. Что касается пандемии, то в провинциях на юге Китая по-прежнему наблюдается небольшое количество новых случаев коронавируса.
Аналитики приветствовали решение центрального банка от 9 июля снизить норму обязательных резервов для банков на 0,5%. Этот шаг был более быстрым и более широким, чем ожидалось, и может дать некоторую страховку от замедления роста во втором полугодии. В июне на рынок облигаций Китая был зафиксирован приток 10 миллиардов долларов. Доходность 10-летних государственных облигаций упала на пять базисных пунктов до 2,97%, впервые с августа 2020 года, когда она упала ниже 3,0%. На валютных рынках юань практически не изменился и закрылся на отметке 6.471 по сравнению с долларом США.
Годовой рост ВВП Китая вырос на 7,9% во втором квартале по сравнению с 18,3% в предыдущем квартале, сообщило в четверг статистическое управление страны. Чтобы уменьшить искажения, связанные с коронавирусом, офис также сообщил о двухлетнем среднем росте, который увеличился на 5,5% во втором квартале с 5% в первом квартале. Устойчивый рост противоречил опасениям рынка по поводу того, что центральный банк снизил норму резервирования из-за слабого роста ВВП. В разрезе секторов сельское хозяйство и сфера услуг в прошлом квартале выросли, в то время как объем промышленного производства стабилизировался после более быстрого восстановления в прошлом году.
Экономические данные заиюня также были оптимистичными.