Параллельный корпус переводов «Слова о полку Игореве»

Параллельный корпус переводов
«Слова о полку Игореве» *

 

Стенограмма совместного заседания семинара Информационные технологии в исследованиях российских филологов и Общества исследователей Древней Руси в Институте мировой литературы им. А. М. Горького 16 мая 2007 года

 

Б. В. Орехов: Начать мне хотелось бы со слов М. Л. Гаспарова: «Каждый перевод, сколь бы он ни был превосходен, проецирует многомерную сложность подлинника на плоскость, делает оригинал упрощённым и представляет его односторонне. Сопоставляя два или несколько переводов, читатель может получить как бы стереоскопическое изображение оригинала, увидеть его с разных сторон». Это бесспорное положение приобретает особенную остроту в случае с таким памятником, как «Слово о полку Игореве». Сложная судьба и поэтическое совершенство этого текста побуждают к всё новым и новым попыткам его передачи средствами современных языков. Всего насчитывается несколько сотен переводов, как на современный русский язык, так и на языки народов России и мира. Естественным образом встаёт насущный технический вопрос о способе хранения и представления всего многообразия переводов в форме, которая позволила бы читателю и исследователю, сравнивая, в максимально удобном режиме следить за трансформацией смыслов, то есть получать искомое «стереоскопическое изображение оригинала».

По нашему мнению, лучшей формой агрегации текстов и их предоставления пользователям является форма параллельного корпуса, реализованная нами с помощью технологии PHP + MySQL. В настоящий момент ресурс имеется в открытом доступе в Интернете по адресу http://nevmenandr.net/slovo. На сегодняшний день представлено около 30 текстов, это число будет увеличиваться и в перспективе должно дорасти до нескольких сотен, охватив максимально возможное число переводов памятника на все доступные языки. По желанию пользователя может быть вызвано сопоставление всех или части этих текстов для одного из 218 фрагментов, на которые поделено «Слово…» (деление предложено Р. О. Якобсоном). Каждое сопоставление имеет уникальную ссылку (URL), так как пользовательский запрос сделан с помощью метода GET, менее безопасного, но дающего возможность в любой момент вызвать сопоставление конкретных фрагментов по сохранённой ссылке. Такой же принцип реализован в большинстве современных поисковых машин. По окончании работы с сопоставлением пользователь имеет возможность «листать» выбранные тексты от фрагмента к фрагменту или вернуться в главное меню для выбора переводов и фрагмента. Для корпуса предусмотрен интерфейс на русском, английском, хорватском, украинском и персидском языках, так как предполагается использование ресурса для обучения русскому языку как иностранному.

Конечно, параллельное представление текста и перевода — вполне привычная эдиционная практика, не раз реализованная и в публикациях «Слова…». Однако формат книги даёт возможность предложить читателю для одновременного ознакомления два, максимум — четыре текста. Они могут быть расположены слева и справа на развороте или втиснуты в две-три колонки (большего не позволит ширина страницы) на одном листе: http://www.rvb.ru/philologica/04/04pilshchikov_t3.htm.

В ситуации со «Словом…» этого недостаточно.

Разумеется, можно поместить другие переводы на следующих страницах, выдерживая линейную композицию книги. Именно так в большинстве случаев и поступают издатели. Но неудобство такой формы очевидно. Владимир Набоков, устами своего героя, настаивавшего на параллельном чтении двух частей романа, предлагал, чтобы обойтись без хлопотного перелистывания назад-вперёд, либо разрезать книгу и скрепить вместе соответствующие страницы произведения, либо купить сразу два экземпляра, которые можно будет положить перед собой.

Весьма утомительно даже сопоставление одного текста и одного перевода на развороте, так как это требует от читателя постоянных усилий по поиску соответствий. Задача становится проще, если текст хорошо структурирован, как, например, в летописи, но другие жанры не предоставляют такого удобства. В нашем корпусе эти трудности снимаются изменением направления текста, который располагается en regard не сверху вниз (колонки), а слева направо (строки). Соответствующие фрагменты текста, таким образом, оказываются друг под другом и дают пользователю полную и наглядную информацию о сходствах и различиях вариантов, переводческих вольностях, разнообразии трактовок. В большинстве случаев это приводит к появлению горизонтальной прокрутки экрана, но традиционные принципы HTML-вёрстки приходится приносить в жертву наглядности. Теоретически можно представить и каждый следующий фрагмент текста для всех переводов располагался бы на следующем развороте подобное бумажное издание с той лишь разницей, что в нём количество переводов было бы ограничено длиной листа (около 40—45 строк), а в корпусе оно ограничено только размером базы данных, которая может содержать миллионы записей. В любом случае воображаемому верстальщику, который вынужден был бы взяться за такую работу, можно только посочувствовать.

В корпус включаются некоторые древнерусские тексты (наиболее авторитетные реконструкции, Первое издание, Екатерининская копия), переводы на современный русский язык, переводы на славянские языки, переводы на западноевропейские языки, переводы на языки народов России и др.

Если будут вопросы, я буду рад на них ответить. Да, пожалуйста.

Проф. Ю. Борев: Ну, вообще, это интереснейшая конечно, работа. Просто новаторская в чём-то. И очень яркая работа. И вот у меня такой вопрос. Не считаете ли вы, что семантической единицей является не строчка, а предложение? Не считаете ли вы, что лучше, чем давать строчки, давать, скажем, рядом, так сказать, предложения ещё? Потому что в строчке могут быть инверсии, может быть, так сказать, недосказанность какая-то, на следующей строчке только продолжение и так далее. А если предложение, то она всё-таки семантическая единица. Это первый вопрос. И ещё второй вопрос. Второй вопрос такой. Мне в руки попал так перевод очень интересный, автора, которого вы, значит, не знаете. Собственно, он не успел его даже опубликовать. Это очень такой неплохой поэт, Юрий Разумовский. Он вообще наследник, так сказать, Разумовского екатерининского вот этого известного фаворита. Вот. Юрий Разумовский. Он хороший такой, современный классик, он лет десять назад умер. И я купил его книгу, более того, я собирался его в своё время публиковать, но, значит, я не считал себя компетентным всё-таки в древнерусских делах и обратился с предложением к Сазоновой Лидии Ивановне. И, значит, она сразу замахала руками: «Ни в коем случае, это же отход». Вы знаете, он, наверное, действительно немножко отходит, но каждый перевод по-своему отходит от первоисточника. Но он дал очень крепкий современный стих. И вот я берусь помочь вам выйти на этот перевод. Это очень крепкий, крепкий такой современный стих. С некоторыми отступлениями, конечно, но с такими допустимыми отступлениями от буквальности.

Б. В. Орехов. Спасибо большое. Спасибо. Если вы позволите, я начну со второго пункта. Значит, естественно, что переводы здесь пока не все. Я то есть на этом акцентировал внимание, что их пока около тридцати, это очень мало, будет больше. Я надеюсь, что будут все в конечном счёте. Так вот, значит, поскольку ресурс сетевой и представлен в Интернете, он некоторым образом рассчитан на пользовательскую инициативу, на инициативу тех, кто этот ресурс заметил и посчитал возможным преодолеть свою какую-то инерцию внутреннюю и связаться с автором, то есть со мной. И вот для этого специально предусмотрен в этом нашем ресурсе такой пункт: «Добавить перевод». Вот здесь есть специальная страница, на которой приведены данные автора, то есть меня, вот со мной можно связаться по этому адресу и написать мне как раз по поводу того, что… то есть прислать перевод, если он есть в электронном виде или просто указать на какие-то неточности и так далее, но главным образом, конечно, если у кого-то есть этот самый в электронном виде перевод, то его, конечно, гораздо проще в корпус ввести. Так вот в качестве помощи подобного рода добровольным помощникам на этой странице приводятся… вот они… переводы, которые в первую очередь могли бы наполнить корпус. Здесь имена вот эти есть. Они, в основном, взяты из тоже Словаря-справочника и из энциклопедии «Слова о полку Игореве», и перевод Юрия Разумовского, как видите, здесь значится. Да, то есть, что он мне совсем неизвестен, я не могу сказать. Вот. Теперь то есть если есть возможность этот перевод оцифровать и ввести в корпус, это было бы, конечно, замечательно и я, естественно, не то что не отказываюсь, я готов всю необходимую по этому поводу работу взять на себя.

Значит, возвращаясь к первому вашему вопросу, который касается деления, в общем-то, на эти самые фрагменты, то прошу обратить внимание, что, так сказать, вот «пляска» здесь не от строчек как раз. Строки здесь указываются для переводов, конечно, но исходным основанием для деления всё-таки выступает древнерусский текст. А он делится, естественно, не по строкам, потому что мы же не знаем длину строки, если она там была, вообще говоря, в древнерусском тексте. Поэтому в качестве этого самого основания для деления используется то деление, и здесь автор этого деления исходил из некоего семантического представления о членении этого текста. То есть, в общем-то… да, структурного, семантического, то есть, собственно, структурно-семантическим единством и является предложение. Да? Но здесь он исходил из некоего более обширного такого понятия, здесь, скорее, не предложение, а что-то такое интуитивно несколько большее, но сопоставимое с предложением. Вот смотрите, допустим, первый фрагмент. Это ведь не строка. Она гораздо длиннее строки. Она вот заканчивается неким… вот там, где, наверное, чтец закончит некий интонационный период. Так что вы совершенно правильно говорите, на мой взгляд, спасибо большое, что обратили на это внимание, что строка была бы слишком короткой. Вот, допустим, строка, пример строки: от вертикальной черты до вертикальной черты. Она, конечно, очень маленькая. И она не даёт необходимого контекста и для понимания, и для сравнения, и удобства здесь никакого нет. А более широкий контекст, вот фрагмент, предложенный, как я уже говорил, Романом Осиповичем Якобсоном, нам показался достаточным контекстом для работы с ним. Ну, в крайнем случае, если действительно что-то вываливается, что-то оказывается в следующем фрагменте важного, то всегда есть возможность не теряя выбора именно тех переводов, которые вас интересуют, пролистать дальше, на следующую страницу, и посмотреть, что там. И потом вернуться назад тоже не составляет никакого труда, потому что есть вот такая панель навигации. То есть я с вами абсолютно согласен, что строка была бы недостаточной, но здесь не строки, здесь нечто как раз более длинное. Спасибо!

Вопрос: У меня сейчас будет вопрос про фрагменты, но несколько с другого уровня. Неважно, как вы делите строку: строки, там, может быть, нечто большее. Но вот, допустим, пользователю есть какая-то необходимость сравнить, ну, скажем так, английский перевод и древнерусский текст, относящиеся к разным фрагментам. Я, конечно, могу открыть несколько окон браузера и смотреть там, но нельзя ли для пользователя сделать поудобнее и взятые параллельно фрагменты поместить где-то рядом?

Б. В. Орехов: Ну, в общем, можно, конечно. Можно поступить и так. Но при, так сказать, концептуальной разработке самого ресурса как раз нам это показалось несколько, так сказать, выбивающимся за границы именно концептуальной вот этой сути, то есть суть в том, чтобы именно сравнивать, так сказать, здесь и сейчас, да? Если нужно сравнить другой фрагмент какой-то, то это будет совершенно другой пример и так далее, и так далее. Здесь, да, боюсь, что придётся открывать несколько окон. Но теоретически, в общем, можно, то есть, это технически выполнимо, вот если, так сказать, за одним фрагментом, вот, допустим, первым, там, три десятка переводов, вот здесь снизу откроется ещё такой же, да? для фрагмента, там, допустим, четвёртого, пятого, восьмидесятого и так далее, и так далее. Технически это можно осуществить, просто здесь я ориентировался как-то на свою интуицию исследователя и читателя, здесь, на мой взгляд, этот ресурс может использоваться и тем и другим. И вот своей внутренней просто потребности в том, о чём вы говорите, не нашёл. Но в самом деле, то есть, со времени создания этого ресурса несколько голосов звучало, которые высказывали мысли подобные вашей, и, наверное, это действительно требует того, чтобы я об этом задумался. Спасибо большое, я непременно об этом подумаю. Возможно, что эту дополнительную функцию по выводу нескольких фрагментов осуществлю.

Вопрос: Вопрос прямо затрагивающий то, по чему ваша разработка пока проигрывает. Как мне кажется, есть две вещи, которые совершенно обязательно рассмотреть, но вы, видимо, просто недостаточно с текстами работаете, у вас такого опыта просто маловато. Во-первых, переводы надо было расположить по хронологии. Потому что пока в ваших переводах нет никакой логики расположения.

Б. В. Орехов: Да, я об этом сказал.

Вопрос: Это первое. Второе. У каждого перевода необходимо обозначить период. И третье. Вы исходили из членения «Слова…» Зализняка.

Б. В. Орехов: Нет, Якобсона.

Вопрос: То есть, Якобсона. Почему нигде не даётся параллельно членение по Ржиге, на котором огромное количество работ основывается. Если вы это сделаете, эту схему, запрос, что при вашей оболочке вполне реально, вы сильно повысите исследовательскую ценность вашей программы.

Б. В. Орехов: Спасибо.

Вопрос: Это второе.

Б. В. Орехов: Это третье.

Вопрос: И третье.

Б. В. Орехов: Уже четвёртое.

Вопрос: Третье. Что я хочу сказать. Пока у вас отсутствует логика расположения в переводах. Вам нужно, по крайней мере, переводы разделить на специальные и неспециальные. Извините, сравнивать перевод Лихачёва и, например, Ивана Алексеевича Новикова, при всём уважении к тому и другому, никому не нужно, уверяю вас. А вот добавить перевод Алексея Югова, которого у вас нет, нужно.

Б. В. Орехов: Пока нет.

Вопрос: И вообще что касается переводов XX века, то тут ваш корпус хромает.

Б. В. Орехов: Нет, он гораздо больше хромает в XIX веке.

Вопрос: Многих переводов у вас нет. Нет Югова, все они давали, особенно Югов давал комментированный перевод, что для исследователя очень ценно. Он входит во все хрестоматии, он и трактует.

Б. В. Орехов: Спасибо, спасибо.

Вопрос: Я вам сказал те замечания, которые, на мой взгляд, глубоко очевидны.

Б. В. Орехов: Понятно.

Вопрос: Пока это ещё программная оболочка, которую вы сделали.

Б. В. Орехов: База данных ещё имеется.

Вопрос: Имеется база данных и делается под неё программная оболочка.

Б. В. Орехов: В самом деле, да. То есть эта программная оболочка не обязательно, в общем, именно для «Слова о полку Игореве» необходима, то есть её можно использовать и для других, в самом деле, текстов, но в случае со «Словом о полку Игореве» переводов больше: количественно больше. Что касается логики расположения переводов в меню. Здесь логика определённая имеется, только, действительно, не хронологическая. Переводы разделены, точнее, сами тексты разделены. В первом блоке, вот, мы видим реконструкцию древнерусского текста, во втором блоке мы видим переводы на современный русский язык, в третьем блоке мы видим переводы на славянские языки, в четвёртом блоке мы видим переводы на другие зарубежные языки, пока здесь только три английских перевода, но, естественно, будут и все остальные рано или поздно, и, наконец, в последнем блоке это переводы на языки народов России. Внутри этих блоков логика хронологическая не представлена. Что касается дат выхода, периодов, то в самом деле, она, я думаю, она должна быть. Пока что само указание на то, когда вышел перевод, здесь присутствует, оно тоже появляется с помощью всплывающей подсказки. Вот эта всплывающая подсказка. Она возникает, когда на соответствующую пиктограмму рядом с именем переводчика наводится курсор. И здесь, соответственно, выводится источник этого самого текста, который помещён в базу данных. Что касается других переводов, которые пока не представлены в корпусе. Коллеги, ещё раз подчёркиваю, что эта разработка находится в начале своего пути, и все переводы, которые известны на данный момент, там рано или поздно будут. В том числе и Югова, в том числе и Разумовского, и так далее, и так далее. Я эти все имена представил на соответствующей странице, это как бы план, да? То есть то, что включено в план. Что касается, значит, ещё, да, других замечаний, которые вы сказали, я боюсь, что я что-то упустил, значит, то… да, по поводу логики расположения в меню я сказал, по поводу отсутствия некоторых переводов тоже, что же я упустил? Что-то важное упустил, простите.

Вопрос: Я сказал вам насчёт Ржиги.

Б. В. Орехов: А, да! Насчёт деления на фрагменты. Дело в том, что нужно было выбирать, нужно было выбирать какое-то одно членение, единообразное, и выбрал я членение, так сказать, Якобсона, а не какое-то другое по той причине, то есть чисто субъективной причине. И, на мой взгляд, здесь, в общем, не так уж и важно, какое именно членение даётся, потому что и вот, на мой взгляд, исследовательская эта ценность каким-то образом не повышается от того или иного членения. В любом случае нужно какое-то такое членение, которое было бы согласовано со здравым смыслом, не более того. Вот. И здесь нужен был выбор просто, так же, как нужен выбор какой-то, не знаю… платформы между… ну, то есть какой-то лучшей среди равных, да? Скажем, при создании какого-то программного обеспечения. На наш взгляд, вот членение Якобсона было достаточно симпатично, не более того. То есть и необходимость в каком-то другом членении вот пока не представляется действительно такой обязательной. Но это на наш взгляд. Вообще об этом стоит подумать, действительно. Другое дело, что это потребует другой базы данных. Другого членения если придерживаться. Но если в конечном счёте, когда появятся все переводы, я думаю, что их можно будет как-то и по-другому тоже разбить. На мой взгляд просто так как-то одного какого-то членения достаточно, но я подумаю над этим, спасибо большое.

Вопрос: А вы не учитывали опыт Национального корпуса русского языка?

Б. В. Орехов: Учитывал, конечно. Сама идея параллельного корпуса, она взята оттуда. (в сторону) Простите, пожалуйста, я сейчас отвечу. Значит, сама по себе идея параллельного корпуса, естественно, восходит к тем достижениям, которые нам известны по корпусной лингвистике и сама операция выравнивания текстов, она, естественно, восходит туда. И в будущем, я надеюсь, что появятся те полезные пользователю вещи, которые даны в корпусе, то есть морфологическая разметка, возможность поиска, и так далее. Но это, конечно, нужно делать на более подробной базе, чем та, что пока имеется. Эта база будет пополняться. То есть те тридцать текстов, которые имеются сейчас, это, конечно, не показательно, но будет гораздо больше, их будет не меньше полутора сотен. Поэтому этот опыт учитывался, да.

Проф. В. Л. Кляус: У меня вопрос такой. Очень кратко. Значит, сколько времени вы работаете над проектом, сколько он висит в сети и сколько у него пользователей?

Б. В. Орехов: Над проектом работа идёт в течение четырёх с половиной месяцев, в сети он представлен с начала февраля, за это время проект ежедневно посещает не менее двадцати пользователей.

Вопрос: Корейские, китайские, арабские, они в эту вашу систему, насколько я понимаю, не могут быть добавлены? Потом. Ведь это визитная карточка древнерусской литературы. Приезжает стажёр из Кореи, а он читал два произведения: «Слово о полку Игореве» и Аввакума, и больше ничего. Из Японии приезжает, а он читал только «Слово о полку Игореве» по-японски, и так далее. Поэтому, может быть, стоит расположить отдельно, если есть какие-то тюркские переводы — отдельно. И последнее. Вот то членение, которое здесь так подробно обсуждается, это не столь важно вообще. Но в данном случае важно для нас членение композиционное. Вот в своей книге Рыбаков предлагает свой вариант членения. Вот это непонятно. «Перепутанные страницы», как у Рыбакова.

Б. В. Орехов: Спасибо!

В. Л. Кляус: Мне кажется, что нужно говорить не о том, каких переводов тут нет. Понятно, что любой перевод можно ввести. А нужно говорить об исследовательской ценности этого проекта. Насколько он отвечает задачам исследователя. Какие можно при помощи этого инструмента получать данные, а может быть, вот всё это, вот этот параллельный корпус, он достаточно ограничен?

Б. В. Орехов: Спасибо большое, Владимир Леонидович. Если позволите, я всё-таки отвечу на реплику, которая прозвучала перед вашими словами. Значит, первое по поводу того, что невозможно корейские или какие-то другие языки ввести в этот корпус, здесь я, конечно, не могу согласиться. Разумеется, это всё возможно технически, это будет представлено здесь. И переводы на идиш, и переводы на иврит, и арабский, никаких совершенно ни технических, ни другого рода проблем здесь не встаёт, не могу согласиться, простите. Также я не могу согласиться с тем, что не могут сравниваться принципиально поэтические и прозаические переводы. Как многие постигают смысл текста, написанного на неизвестном языке, по подстрочнику, сравнивая его с поэтическим текстом, сделанным на основе этого подстрочника, я думаю, что точно так же возможно и дбский, никани для научного, на мой взгляд, ни для просто читательского опыта чем-то непредставимым или даже крамольным. И наконец по поводу того, что нужно отдельные страницы сделать для тюркских, там, английских, польских переводов, то, на мой взгляд, тоже в этом нет особенного смысла, потому что ведь может кому-то потребоваться сравнить английский, польский, чешский и русский перевод. И вот такую возможность ему даст то меню, которое представлено здесь сейчас. Мы можем в данный момент сравнить перевод любой из пока что имеющихся, русский, одновременно перевод на украинский язык, на английский язык и на башкирский. Вот, если кто-то им владеет, то тоже вполне это возможно. Ровно так же, допустим, польский какой-нибудь читатель, когда польские переводы появятся, а они непременно появятся в этом корпусе, сможет сравнить известные ему польские переводы и какой-нибудь перевод на русский язык. И это ему даст именно единое меню. В котором не разводятся по языкам, то есть не то что не разводятся, а не разграничиваются непроходимой стеной переводы на разные языки. То есть на мой взгляд как раз, вот для меня, опять-таки, я обращаюсь к своей интуиции читателя и исследователя, на мой взгляд, потребность сравнить переводы на разные языки у читателя, у исследователя может возникнуть. И поэтому разводить по отдельным страницам ни идеологически, ни морально не представляется необходимым. Вот мне так показалось. Но, безусловно, я благодарю вас за ваше замечание и непременно буду думать над тем, о чём вы говорите.

Вопрос: А пока это меню зафиксировано, да? То есть мы не можем, допустим, вывести переводы по тому, в каком году они появились.

Б. В. Орехов: Пока что зафиксировано, да. То есть в том виде, в котором это представлено в меню…

В. Л. Кляус: Но технически это возможно.

Б. В. Орехов: Технически возможно.

В. Л. Кляус: Расположить переводы по времени выхода, по…

Б. В. Орехов: …по алфавиту.

В. Л. Кляус: …по именам авторов.

Б. В. Орехов: Да, то есть то членение, которое имеется в меню, — это членение по языкам. Да? То есть по языковым, вернее сказать, группам даже. И представить их в каком-то другом виде, безусловно, возможно без особенных проблем.

А. С. Дёмин: Вот можно спросить. А аналогичные работы предпринимались по библейским переводам?

Б. В. Орехов: Я думаю, что да. Мне кажется, что касается Библии, то тут всё предпринималось, что было возможно.

А. С. Дёмин: И второй вопрос. Может быть, как-то в меню дать разные варианты членения «Слова…».

Б. В. Орехов: Ну да, я уже уловил, что вопрос о выборе членения, не о, так сказать, конкретном решении в соответствии с выбранным членением, куда отнести тот или иной фрагмент, то или иное слово, это, видимо, действительно такой момент очень острый, я понял, что на это стоит обратить внимание. То есть в принципе, конечно, членений много. Ну, не безумно много, не столько, сколько переводов, но их существует достаточное количество, по разным принципам и основаниям они сделаны. Пока что вот мне всё же не кажется необходимым уходить совсем от членения Якобсона, но то, что о других членениях можно вспомнить, я это понял и приму во внимание.

Я забыл, что я не ответил ещё на один вопрос, действительно очень острый, касающийся тех переводов, в которых в композиционном смысле не всё так последовательно, как в тексте оригинала. Как показывает практика распределения текста по фрагментам, вот таких случаев с инверсией, когда в целом как-то оказывается всё переставленным и так далее, и так далее, не очень много. Ну, то есть естественно, что все вы знакомы с этой проблемой перестановки, предпринятой ещё Соболевским, да? Касающейся вот этого фрагмента с рассказом о затмении, вклинившемся во введение. На самом деле, эта проблема существует, и такие перестановки, как было справедливо отмечено, предлагаются и Рыбаковым. Что с ними делать? Они не могут быть игнорированы, с этим я совершенно согласен. Но в данном случае если уж мы сравниваем, коль скоро мы сравниваем какие-то, наверное, в первую очередь всё-таки семантические пласты, то имеет смысл всё же таки пойти против какой-то издательской, не знаю, как сказать, справедливости, и обозначить, что выравнивание было проведено, но привести к единому, унифицированному виду. В соответствии с тем порядком, который принят в Первом издании, значит, в переводах, где эта перестановка предпринята, просто мы поместили специальную пиктограмму (). Сейчас, я надеюсь, что всё загрузится и я её покажу.

Ю. Борев: А есть же те, кто считает, что в «Слове о полку Игореве» акростихи зашифрованы.

Б. В. Орехов: Ну, пусть ищут. А может быть, найдут её в переводах, я не знаю. Обратите внимание, коллеги, значит, вот здесь в начале строки в некоторых переводах мы видим вот такую вот пиктограмму (). Это стрелка. Вот эта стрелка означает, что в этих переводах принимается перестановка, которую предложил Соболевский. Эти тексты, тем не менее, выровнены в соответствии с тем порядком, который мы имеем по Первому изданию. Но, то есть, сравнение, вот это параллельное представление у нас перед глазами остаётся, но о факте самой перестановки мы не забываем. То есть вот эта пиктограмма служит вот этим самым сигналом, что всё действительно не так просто в композиционном смысле. Дальнейшие выводы нужно, естественно, делать исследователю. И второй момент, когда в случае инверсии или в каких-то других случаях сложных в переводческом отношении появляется такой вот момент, когда какому-то фрагменту по тому членению, которое предложил Якобсон, вот ничего не соответствует. Что с этим делать? Действительно, вот 86-й фрагмент. В переводе Заболоцкого получается, что если последовательно его представлять, то он пустой просто. Ничего вот тут не появляется. Но, однако же, в 87-м фрагменте вот примерно смысл этого 86-го фрагмента, у Заболоцкого, в смысле, в 87-й этой части вот эта часть текста есть. И вот здесь, вы видите, есть ссылка на следующий фрагмент, и подсказка, как это в переводе Заболоцкого вообще передано. Но сама композиционная проблема этим не снимается, то есть на неё внимание пользователя обращается, что да, действительно, у Заболоцкого получается инверсия, которая приводит вот к этому. Но 87-й фрагмент, и ссылка на него стоит, и вот это следующий фрагмент, к нему мы можем перелистнуть и увидеть содержание и 87-го фрагмента по Якобсону древнерусского, и соответствие ему у Заболоцкого, и одновременно же включённый в него 86-й фрагмент. Вот, видите, он получается аномально длинным именно потому что в нём находится содержание и 87-го, и Заболоцкий переставил, ввёл ещё и 86-й. То есть работать с ним по-прежнему можно, сравнивать, как там в оригинале и в переводе, можем, но сама композиционная проблема не должна как-то зачёркиваться в этом корпусе. И мы полагаем, что какое-то более или менее такое дипломатичное решение, такое, максимально, насколько возможно, уважительное и по отношению к переводчику, и по отношению к оригинальному тексту, здесь найдено.

В. Л. Кляус: Вам лично как исследователю этот инструмент дал какую-то мишень для разработок? Вы или ваши коллеги из Уфы опубликовали что-то на материалах корпуса?

Б. В. Орехов: Нет, пока в работе. Опубликованных статей нет ещё. За 4 месяца. В Москве, наверное, за 4 месяца уже что-то публикуют, у нас пока не столь всё оперативно, поэтому нет: написанных статей именно по материалам корпуса пока нет. Но я думаю, что они будут, да. Они будут касаться вот именно проблемы перевода, то есть не столько самого оригинального текста, хотя, на мой взгляд, и я упоминал об этом, может быть, вскользь излишне, что всё-таки на исследование оригинального текста «Слова о полку Игореве» это тоже может повлиять. Но, что касается проблемы перевода, то лично мне удалось сделать несколько наблюдений по этому поводу, и я надеюсь, что они будут изложены рано или поздно в соответствующих публикациях.

С. Б. Потёмкин: Скажите пожалуйста, ну, вообще, конечно, очень интересная работа, у меня несколько технических вопросов. Чтобы он был корпусом, всё-таки должна быть обязательно возможность поиска. Потом, значит. Когда вы говорите о морфологической разметке, это всё-таки трудно довольно.

Б. В. Орехов: Ну почему? Не так уж. Ну, что касается распространённых западноевропейских языков.

С. Б. Потёмкин: Мне кажется, это довольно трудно. А не хотели бы вы установить пословное соответствие там, где это возможно. Да, ещё последний вопрос — это какая кодировка у вас используется?

Б. В. Орехов: Спасибо! Значит, что касается кодировки, кодировка — Windows-1251. Дело, как вы понимаете, не в кодировке, а в шрифте. Шрифт выбран Palatino Linotype, он позволяет как раз позволяет древнерусские буквы. Кодировка позволяет работать со шрифтом так, чтобы всё адекватно отображалось. По техническим причинам выбран один шрифт для всех, хотя использовать Palatino для современного русского языка было бы необязательно, здесь можно было бы использовать любой другой распространённый шрифт, который понимают браузеры пользователя.

С. Б. Потёмкин: Эта проблема возникнет, когда вы будете делать поиск.

Б. В. Орехов: Это всё решаемо. Совершенно верно насчёт поиска. Поиск будет. Просто, на мой взгляд, он должен делаться тогда, когда появится достаточная база. База пока ещё недостаточная, очень недостаточная. Поиск будет, уже работа над ним ведётся. Он должен содержать определённые правила, исключения и так далее, и так далее. Всё это разрабатывается, будет специальная страница для поиска, он будет искать по этой базе. Грамматическая разметка тоже будет. Это касается русского литературного языка. Что касается основных языков западноевропейских, то она тоже будет сделана. Тут я как раз рассчитываю на помощь сотрудников, занимающихся Национальным корпусом русского языка. У нас с ними хорошие довольно контакты, и первоначально эта разработка планировалась как некий подкорпус внутри национального корпуса русского языка, но по техническим причинам это всё не сложилось, и я реализовал это всё отдельно. Ссылки на Национальный корпус стоят, так что, в общем, мы дружим. И поэтому грамматическая разметка будет, спасибо большое, что Вы обратили на это внимание. Что касается кодировки, то все эти проблемы решаемы, просто нужна какая-то одна платформа, под которую технически подстраивать всё остальное.

С. Б. Потёмкин: А пословные соответствия?

Б. В. Орехов: Да, пословные соответствия. Не то что это технически невыполнимо, но пословные соответствия при таком представлении текста (это особенно хорошо видно по первому фрагменту) пользователь может установить сам. Уже при создании корпуса, который здесь предлагается, это подразумевалось. А установление соответствий уже в самой структуре корпуса — это определённое навязывание. На мой взгляд нужно максимально дипломатично подойти к пользователю и не навязывать ему какие-то решения. Не умалчивать о проблемах, которые встают при выравнивании (это перестановки, о которых совершенно справедливо сказали), обратить на них внимание — нужно. А пословное соответствие требует гораздо большей аналитической работы именно от составителя, и здесь гораздо больше придётся принимать сомнительных решений.

С. Б. Потёмкин: Но где это очевидно, например, «Игорь — Игорь — Игорь — Игорь». Можно ведь?

Б. В. Орехов: Да. Но это частный случай.

С. Б. Потёмкин: Хотя бы где такое соответствие безусловное.

Б. В. Орехов: Вопрос о том, где оно безусловное, а где нет, в некоторых случаях будет очень дискуссионным. На мой взгляд, это лишнее, но спасибо за Ваше замечание, об этом можно подумать, но пока мне кажется (может быть, я изменю своё решение), что это некоторое навязывание пользователю. Исследователь первым же взбунтуется против такого навязывания. Оно будет требовать очень внушительного обоснования, а само решение, может быть, будет излишним, но об этом стоит подумать, спасибо большое.

Вопрос: К вашему ресурсу, вероятно, будут обращаться и зарубежные пользователи. Это может привести к проблемам с несоответствиями кодировок при поиске и так далее. Учитываете ли вы это?

Б. В. Орехов: Ещё раз подчёркиваю, что что касается кодировки, то это не принципиальный момент в данном случае. Кодировка определяется современными браузерами достаточно хорошо. Что касается пользователей из-за рубежа, то для них предусмотрен зарубежный интерфейс, я об этом не сказал. Вот здесь эти флажки, они означают как раз интерфейс на соответствующем языке. Предусмотрен интерфейс на русском, английском, хорватском, украинском, персидском языке ­— это то, что уже есть. А будет ещё на польском, будет ещё, я надеюсь, когда-нибудь на немецком. Может быть, будет ещё. Это вопрос во многом материальной поддержки этого проекта. Если удастся получить под него грант, то всё состоится. Браузеры, если до совсем технического уровня опускаться, браузеры действительно бывает что затруднёно понимают кодировку автоматически, если это кодировка Юникод. Кодировку, выбранную в данном случае, кодировку Windows, браузеры определяют очень хорошо, в том числе, и из-за рубежа. Что касается поиска, то это следующий вопрос, который будет решаться по ходу. Что касается интерфейса, по крайней мере, то здесь никаких проблем не будет. Вот здесь вы можете увидеть, прописана в коде страницы:


<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">

<html>

<head>

<title>«Слово о полку Игореве». Параллельный корпус переводов</title>

<meta http-equiv="Content-Type" content="text/html; charset=windows-1251">

<link rel="shortcut icon" href="favicon.ico">

<link href="slovo.css" rel="stylesheet" type="text/css">

<script type="text/javascript" language="JavaScript" src="scriptsheet.js"></script>


и браузером будет понята без проблем. Что касается поиска, то будет предусмотрено, насколько это возможно, чтобы у пользователя не возникло никаких проблем, когда до этого дело дойдёт. Пока, подчёркиваю ещё раз, первейшее и главнейшее, что требуется, — это пополнение базы переводов.

В. Л. Кляус: У вас можно читать текст только по фрагментам. Но пользователю может потребоваться увидеть весь текст, чтобы понять те задачи, которые ставил перед собой переводчик. Это с одной стороны. С другой стороны, для той же цели может быть полезно сравнение нескольких разных фрагментов.

Б. В. Орехов: Спасибо большое. Что касается вот этого психологического момента, как именно это будет представлено (из этого исходит концепция, действительно, это важно), тут стоит подумать. Я думаю, что это должно быть в отдельном окне. Спасибо большое. Что касается полного представления перевода, то довольно много раз я слышал это предложение, и, конечно, не могу от него отмахиваться. Видимо, в конце концов это будет сделано1. Почему это не сделано до сих пор — потому что это определённым образом размывает именно саму концепцию представления текста, потому что изначально сам корпус появился из идеи представить текст именно так. Подразумевается, что текст с пагинацией, представленный полностью, должен быть частью какого-то другого проекта, например, Фундаментальной электронной библиотеки, и именно туда можно отсылать пользователя за полным текстом. То есть это несколько другая задача. В принципе, можно было бы добавить сведения о переводчиках, и так далее, и так далее, но раз это в другом месте, то здесь делать это не обязательно.

В. Л. Кляус: Но о башкирских переводчиках в ФЭБ нет сведений, например.

Б. В. Орехов: Оба эти проекта открыты в будущее. Может быть, когда-нибудь там будет вся информация. Хорошо, я, естественно, учту это замечание. Возможно, действительно всё это появится.

Ю. Борев: Знаете, я рекомендовал бы вам подумать о такой возможности: сочетать горизонтальное представление текста с вертикальным. Слева дать русский перевод, а справа персидский, немецкий, если он будет.

Б. В. Орехов: Будет. И не один немецкий, их очень много.

Ю. Борев: Сочетание горизонтального и вертикального представления даст вам, как мне кажется, больше возможностей.

Б. В. Орехов: Спасибо большое. Что касается русских, иностранных, то я это отдаю просто на откуп пользователя. Он сам выбирает, что ему нужно. Поставит галочку на немецких переводах — их и видит. Поставит на русских — видит только их, немецкие не видит. Что касается горизонтального и вертикального — спасибо, я подумаю, но пока что мне кажется, что это надо оставить на выбор тому, кто придёт пользоваться этим ресурсом.

Вопрос: Вертикальная черта, обозначающая у вас деление на строки, напоминает букву «I», и мне даже показалось, что это опечатка: два раза «I», как будто. Нельзя ли как-то выделить этот знак, например, цветом?

Б. В. Орехов: Это недостаток того, что проектор представляет текст расплывчато, потому что используется шрифт с засечками, и на экране компьютера, даже если стоять довольно далеко от него, видно, что «I» с засечками, а вертикальная черта без. Кроме того, они отличаются по высоте, и отличаются по внешнему виду достаточно чётко. Но можно поменять цвет, это особых проблем не вызовет. Что касается цветового представления, то здесь богатые возможности, я их не до конца, конечно, использовал, над этим ещё нужно работать. Спасибо, в самом деле, на это стоит обратить внимание.

Вопрос: У меня вот есть текст перевода «Слова о полку Игореве» без указания авторства. Можно ли с помощью вашего корпуса определить, что это за перевод?

Б. В. Орехов: Когда будет поиск, можно будет сделать достаточно просто. Пока что «вслепую» сделать этого нельзя. Но если применить операций больше, чем одну, то тогда можно. Значит, что нужно сделать, чтобы определить, какой это перевод (если он есть в корпусе). Делается это следующим образом. Вы открываете меню с фрагментами, ссылка на которое стоит на первой странице, ищете номер этого фрагмента по членению Якобсона, около соответствующего фрагмента здесь можно поставить галочку, и после этого нажать на кнопку «Выбрать», и все переводы этого фрагмента перед вашими глазами будут. И вы сможете путём визуального сравнения того, что есть в книге и на экране, сравнить, и уяснить, чей это перевод, имена переводчиков тут рядом. Для этого нужно совершить примерно три операции. Когда будет поиск, это можно будет сделать при помощи одной операции: в строку запроса вы введёте соответствующую строку из книги, и выдача вам покажет, кто переводчик.

Вопрос: А можно будет сейчас посмотреть по вашему корпусу то, что у меня тут в книге?

Б. В. Орехов: То есть чисто практическая задача? Давайте! Если, конечно, этот перевод есть в корпусе, то на ваш вопрос можно будет ответить. Пока, к сожалению, маленькая база.

В. Л. Кляус: Это ваш личный проект или он поддержан кем-то?

Б. В. Орехов: Пока это проект сам по себе. На что тут нужны деньги-то? На оцифровку просто, чтобы сделать копии переводов…

В. Л. Кляус: Это всё понятно. Но вот включён ли проект в план какого-то учреждения?

Б. В. Орехов: Не включён пока. Это, если позволите, частная инициатива. Нет, ни в какие планы это не включено, но в учебную деятельность моих коллег корпус входит. Как раз сегодня мне прислали sms из Уфы с сообщением о том, что, оказывается, на практическом занятии по текстологии моя коллега использовала корпус. Так что ни в каких официальных планах это не состоит, но я надеюсь, более официальный статус проект получит, когда будет получен какой-нибудь грант. Я надеюсь, что он будет.

В. Л. Кляус: Нет больше вопросов никаких?

Б. В. Орехов: Большое спасибо всем, кто высказался, для меня это очень ценно.

 

В Институте мировой литературы им. А.М. Горького 16 мая 2007 года прошла презентация корпуса. На этой странице можно ознакомиться со стенограммой заседания.


* В 2008 году развитие корпуса осуществлялось при финансовой поддержке РГНФ в рамках проекта создания информационной системы «Параллельный корпус переводов „Слова о полку Игореве“», проект № 08–04–12104в

© Борис Орехов 2007
nevmenandr.net