Тема 6. Видеолекция автора

ТЕМА 6. ПРИКЛАДНАЯ лексикография И КОРПУСНАЯ ЛИНГВИСТИКА

(видеолекция) 

 

strelka.jpg 

 

https://www.youtube.com/watch?v=4xtkIEzKm9A

6.1. Электронные словари и компьютерная лексикография

6.2. Корпусная лингвистика как база для электронных словарей

  img_foto.jpg

6.1. Электронные словари и компьютерная лексикография

Термин "электронный словарь" стал уже привычным. При этом атрибут "электронный" характеризует свой объект настолько же поверхностно,  насколько противоположный ему атрибут "бумажный" - традиционные словари. Обычно подразумевается, что словарь на компьютере -  это введенный в него бумажный словарь, снабженный удобными средствами поиска и отображения.

Компьютерная лексикография является особым направлением в практической лексикографии со своими собственными подходами не только к отображению, но и к содержанию словаря.

Необходимо сразу оговориться, что речь идет о тенденциях, потенциальных возможностях компьютерной лексикографии, часть которых еще не реализована или даже еще не осознана.

Прежде чем перейти к обсуждению новых возможностей, остановимся на проблемах классической "бумажной" лексикографии. Плоды традиционной практической лексикографии страдают от трех фундаментальных противоречий, характерных для этой области человеческой деятельности:

1. Чем больше объем словаря, чем полнее и доказательнее  описание лексических значений, тем сложнее им пользоваться.

Это противоречие привело к поляризации рынка бумажных словарей:  имеется большая группа массовых изданий, довольно примитивных, но относительно удобных, которой противостоят единичные пудовые профессиональные издания, непригодные для быстрого получения информации. Характерный пример - 20-томный Оксфордский словарь.

2. Чем полнее и глубже описание лексических значений, тем в меньшей степени словарь соответствует текущей языковой и культурной ситуации.

Чрезвычайно долгий цикл создания и модификации фундаментальных бумажных словарей приводит к тому, что образ мира, который они фиксируют в системе своих значений, примеров и переводов, уже заметно отличается от действительности. Многие словари, основной корпус статей которых сформировался в языковой атмосфере середины века, представляют собой лексикографические музеи (а то и терминологические кладбища, если говорить о специализированных словарях).

3. Чем интереснее собственно лексикографическая концепция словаря, чем интегральнее средства описания лексических значений, тем  у'же его лексическая база.

В результате, универсальные бумажные словари демонстрируют печальное отсутствие влияния достижений теоретической лексикографии на лексикографическую практику. Научные лексикографические проекты существуют, но реализуются в виде словарей, не покрывающих и 10% всего лексикографического пространства. Например, в знаменитом Толково-Комбинаторном Словаре (ТКС) под ред. Мельчука и Жолковского [1] описано всего около 400 лексических значений русского языка.

Компьютерная (машинная) лексикография  занимается  решением проблем создания и функционирования электронных словарей разных типов.

Мы полагаем, что электронный словарь - это особый лексикографический объект, в котором могут быть реализованы и введены в обращение многие продуктивные идеи, не востребованные по разным причинам в бумажных словарях.

Электронный словарь – это словарь в компьютере или другом электронном устройстве, работающий благодаря комплексу сложнейших программ и алгоритмов.

Электронный словарь – компьютерная база данных, содержащая особым образом закодированный словарные статьи.

Например: компьютерные аналоги толковых словарей английского языка (автоматический Вебстер, автоматический толковый словарь английского языка издательства Коллинз, автоматический вариант Нового большого англо-русского словаря под ред. Ю.Д.Апресяна и Э.М.Медниковой), компьютерная версия словаря С.И. Ожегова.

Автоматические словари для программ обработки текста можно назвать автоматическими словарями в точном смысле. Они, как правило, не предназначены для обычного пользователя. Особенности их структуры, сфера охвата словарного материала задаются теми программами, которые с ними взаимодействуют.