Тема 6. Видеолекция автора
ТЕМА 6. ПРИКЛАДНАЯ лексикография И КОРПУСНАЯ ЛИНГВИСТИКА
(видеолекция)
6.1. Электронные
словари и компьютерная лексикография
6.2. Корпусная лингвистика как база для электронных
словарей
6.1. Электронные словари и компьютерная лексикография
Термин "электронный словарь" стал уже привычным. При этом атрибут "электронный" характеризует свой объект настолько же поверхностно, насколько противоположный ему атрибут "бумажный" - традиционные словари. Обычно подразумевается, что словарь на компьютере - это введенный в него бумажный словарь, снабженный удобными средствами поиска и отображения.
Компьютерная
лексикография
является особым направлением в практической лексикографии со своими собственными
подходами не только к отображению, но и к содержанию словаря.
Необходимо
сразу оговориться, что речь идет о тенденциях, потенциальных возможностях
компьютерной лексикографии, часть которых еще не реализована или даже еще не
осознана.
Прежде
чем перейти к обсуждению новых возможностей, остановимся на проблемах
классической "бумажной" лексикографии. Плоды традиционной практической
лексикографии страдают от трех фундаментальных противоречий, характерных для
этой области человеческой деятельности:
1.
Чем больше объем словаря, чем полнее и доказательнее описание лексических значений, тем
сложнее им пользоваться.
Это
противоречие привело к поляризации рынка бумажных словарей: имеется большая группа массовых изданий,
довольно примитивных, но относительно удобных, которой противостоят единичные
пудовые профессиональные издания, непригодные для быстрого получения информации.
Характерный пример - 20-томный Оксфордский словарь.
2.
Чем полнее и глубже описание лексических значений, тем в меньшей степени
словарь соответствует текущей языковой и культурной
ситуации.
Чрезвычайно
долгий цикл создания и модификации фундаментальных бумажных словарей приводит к
тому, что образ мира, который они фиксируют в системе своих значений, примеров и
переводов, уже заметно отличается от действительности. Многие словари, основной
корпус статей которых сформировался в языковой атмосфере середины века,
представляют собой лексикографические музеи (а то и терминологические кладбища,
если говорить о специализированных словарях).
3.
Чем интереснее собственно лексикографическая концепция словаря, чем
интегральнее средства описания лексических значений, тем у'же его лексическая база.
В
результате, универсальные бумажные словари демонстрируют печальное отсутствие
влияния достижений теоретической лексикографии на лексикографическую практику.
Научные лексикографические проекты существуют, но реализуются в виде словарей,
не покрывающих и 10% всего лексикографического пространства. Например, в
знаменитом Толково-Комбинаторном Словаре (ТКС) под ред. Мельчука и Жолковского
[1] описано всего около 400 лексических значений русского
языка.
Компьютерная
(машинная) лексикография
занимается решением проблем
создания и функционирования электронных словарей разных типов.
Мы
полагаем, что электронный словарь -
это особый лексикографический объект, в котором могут быть реализованы и введены
в обращение многие продуктивные идеи, не востребованные по разным причинам в
бумажных словарях.
Электронный
словарь
– это словарь в компьютере или другом электронном устройстве, работающий
благодаря комплексу сложнейших программ и алгоритмов.
Электронный
словарь – компьютерная база данных, содержащая особым образом закодированный
словарные статьи.
Например:
компьютерные аналоги толковых словарей английского языка (автоматический
Вебстер, автоматический толковый словарь английского языка издательства Коллинз,
автоматический вариант Нового большого англо-русского словаря под ред.
Ю.Д.Апресяна и Э.М.Медниковой), компьютерная версия словаря С.И. Ожегова.
Автоматические
словари для программ обработки текста можно назвать автоматическими словарями в
точном смысле. Они, как правило, не предназначены для обычного пользователя.
Особенности их структуры, сфера охвата словарного материала задаются теми
программами, которые с ними взаимодействуют.