Определение слова «Тезаурус» по БСЭ:
Тезаурус (от греч. thesaurуs — сокровище, сокровищница)множество смысловыражающих единиц некоторого Языка с заданной на нём системой семантических (см. Семантика) отношений. Т. фактически определяет семантику языка (национального языка, языка конкретной науки или формализованного языка для автоматизированной системы управления). Первоначально Т. рассматривали как одноязычный словарь, в котором семантические отношения определяются группировкой слов по тематическим рубрикам. Например, английский Т. (автор П. М. Роджет), изданный в 1962 (1-е издание 1852), содержит 1040 рубрик, по которым распределено около 240 000 слов. Указатель (ключ) к этому Т. содержит алфавитный перечень слов с указанием рубрик и подрубрик, к которым относится каждое слово. Существуют традиционные общеязыковые Т. (описания семантических систем отдельных языков) для английского, французского, испанского языков. К Т. весьма близки одноязычные словари, задающие выражения основных семантических параметров каждого слова, например словарь русского языка С. И. Ожегова.В 70-х гг. 20 в. получили распространение информационно-поисковые Т. В этих Т. выделены специальные лексические единицы — Дескрипторы, по которым можно осуществлять автоматический поиск документальной информации. С каждым словом такого Т. сопоставляется синонимичный дескриптор (см. Синонимия), и для дескрипторов явным образом указываются семантические отношения: род — вид, часть — целое, цель — средство и т. д. Обычно принято разделять родо-видовые (иерархические) и ассоциативные отношения. Так,«Информационно-поисковый тезаурус по информатике», изданный в СССР в 1973, для каждого дескриптора предусматривает словарную статью, где отдельно указаны синонимичные ключевые слова, родовые, видовые и ассоциативные дескрипторы. Для лучшей ориентации в ассоциативных связях между дескрипторами к этому Т. приложены семантические карты тематических классов. При автоматизированном информационном поиске ищутся документы, у которых индекс содержит не только дескрипторы запроса, но и те дескрипторы, которые находятся с ними в определённых семантических отношениях. Иногда бывает полезно выделять в Т. конкретные ассоциативные отношения, специфичные для данной тематической области: болезнь — возбудитель, прибор — назначение (или измеряемая величина) и т. п. Положение лексической единицы (слова, словосочетания) в Т. характеризует его смысл в языке. знание системы семантических отношений, в которые вступает данное слово (в том числе и рубрик, куда оно входит), позволяет судить о смысле этого слова.В широком смысле Т. интерпретируют как описание системы знаний о действительности, которыми располагает индивидуальный носитель информации или группа носителей. Этот носитель может выполнять функции приёмника дополнительной информации, вследствие чего изменяется и его Т. Исходный Т. определяет при этом возможности приёмника при получении им семантической информации. В психологии и при изучении систем с искусственным интеллектом рассматривают свойства Т. индивидуумов, проявляющиеся при восприятии и понимании информации. В социологии и теории коммуникаций изучают свойства Т. индивидуумов и коллективов, обеспечивающие возможность взаимопонимания на основе общности Т. В этих ситуациях в Т. приходится включать сложные высказывания и их семантические связи, определяющие запас сведении, которыми располагает Сложная система. Т. фактически содержит не только информацию о действительности, но и метаинформацию (сведения об информации), обеспечивающую возможность приёма новых сообщений.Лит.: Черный А. И., Общая методика построения тезаурусов, «Научно-техническая информация. Сер. 2», 1968, №5. Варга Д., Методика подготовки информационных тезаурусов, пер. , М., 1970. Шрейдер Ю. А., Тезаурусы в информатике и теоретической семантике,«Научно-техническая информация. Сер. 2», 1971, № З.Ю. А. Шрейдер.
Виды тезаурусов
Многообразие словарей требует рассматривать не только вопрос: «Тезаурус: что это?», но и обращать внимание на виды. Это поможет нам лучше усвоить особенности данного типа словарей
- Словари по отдельным отраслям знаний – филологические, педагогические, философские и пр. тезаурусы. Представляют перечень специальных терминов с указанием всех возможных связей между ними.
- Информационно-поисковые (ИПТ) – используются в качестве инструмента для автоматического или ручного поиска информации. В институтах создано около сотни отраслевых тезаурусов, которые соответствуют государственным стандартам. Из возможных смысловых связей между понятиями они используют три: родовидовые, синонимические и ассоциативные (все остальные).
- Тезаурусы конкретного языка. Например, WordNet – знаменитый тезаурус английского языка, создан для подробной характеристики лексики и понятийного аппарата.
- Многоязычные (универсальные) – позволяют находить слова, связанные между собой, из разных языков.
- Имеются и нестандартные тезаурусы, ставящие задачу выборочной систематизации терминов в определенной области знаний, что наиболее приемлемо для новейших предметных областей.
Отношения слов в тезаурусе
Самыми распространенными отношениями в классическом тезаурусе считаются:
- Синонимия – явление, при котором связываются слова одной части речи, сходные по лексическому значению. Например: держава-отчизна, бригада-отряд, алый – красный и т.д.
- Антонимия – связь слов одной части речи, имеющих противоположное лексическое значение. Например: тишина – грохот, ласковый – грубый.
- Гиперонимия (гипонимия) – ключевые отношения с целью описания существительных. Гипероним имеет широкое лексическое значение, выражает родовое, общее наименование класса (множества) объектов, предметов, а именно его свойств и признаков. Гипоним обладает узким значением, он называет предмет (признак, свойство) как элемент конкретного множества или класса. Для того чтобы эти отношения стали понятными, приведем простейший пример. Слова зверь и тигр связаны между собой, при этом общее наименование — зверь — является гиперонимом по отношению к гипониму тигр.
- Меронимия (партонимия) – отношения для существительных, складываются по принципу «часть – целое». В качестве примера рассмотрим слова самолет, шасси, иллюминатор. В данном случае общее наименование транспорта – холоним (целое, имя), а его составные части – меронимы.
- Следствие (отношения между глаголами). Например, слова идти и прийти связаны процессом и его следствием (результатом).
- Причина (также допустимо только для глаголов). Рассмотрим пример таких отношений, возьмем слова: болеть – пропустить. В этом случае прослеживается причина — пропустить, потому что были проблемы со здоровьем.
Что тезаурус представляет собой, увидим из следующего примера.
Кровать – приспособление для сна.
: мебель : дом : лежанка, полати.
Это лишь классический пример тезауруса русского языка, однако все словари данного типа строятся именно по такому принципу.