Как устроено современное информационное обеспечение: часть 2. Тезаурус


тезаурус обезьян

Тезаурус – такое непонятное слово, что захотелось вынести его в отдельный раздел статьи. И обсудить более детально.

Как только математики-информатики определились с определениями, так сразу же источниками и преемниками информации занялись спецслужбы. При этом каналами передачи информации занялись инженеры (и тоже спецслужбы!), а вот информационный тезаурус они оставили математикам-информатикам, так как ни черта в этом не смогли понять! Шутка.Просто тезаурус и стал тем важнейшим компонентом информационного обмена, без которого немыслимо современное информационное обеспечение. Им-то и занялись всерьез.

Действительно, а можно ли определить, что такое информационный тезаурус? Математики никогда не боятся давать определений. Они сразу же сказали, что тезаурус – это множество дескрипторов. Коротко и ясно! А ведь действительно, что может быть проще? Например, глюкало – это набор финти-флюшек. Финти-флюшка очень напоминает множество смурзиков. Не так ли?!

Но оказалось, что не смешно, а полезно. Все сразу упростилось.

Если тезаурусы источника и приемника информации совпадают полностью, то это значит (по определению математиков!), что у них эти тезаурусы состоят из одинаковых дескрипторов. Верно? А как это звучит по-русски?

Если два человека говорят на одном языке, то они пользуются одними и теми же словами. Вот и весь перевод с математического языка на русский.

А если тезаурусы совпадают частично, это значит, что только некоторые дескрипторы этих тезаурусов совпадают. Один человек учил английский в школе, а другой вырос в Великобритании. Но «hi» (здесь – «привет») и «bye» (здесь – «пока») они, как ни странно, понимают одинаково. Значит, могут поздороваться и даже попрощаться. То есть, некоторые дескрипторы их тезаурусов являются общими!

Ну и какой от этого прок? В чем практическая жилка информационных тезаурусов? Можно согласиться, что если под эти понятия подводить только общечеловеческое общение, то ничего, кроме силы абстрактного мышления математиков, мы не увидим. А только сможем восхититься, как эти математики-информатики (возможно, за государственный счет!) обогащают свой научный язык.

общение людей с компьютерами

Но все не так просто, когда появляются человеко-машинные системы. Когда начинается общение людей с компьютерами (по сути, с программируемыми автоматами). Когда, хоть убейся, компьютер не научишь понимать простую, хотя бы русскую речь. Ну ладно, пусть хоть бы английскую, они ведь нас обогнали в этих вопросах (ну ничего, мы им еще покажем, например, на ниве космоса!). «Я б выучил английский только за то, что его понимает компьютер!» – так можно было бы перефразировать очередного классика.

Увы, обогнать-то обогнали, но английскому компьютер не обучишь, и китайскому тоже, и вообще никакому языку не получится обучить. Тут тоже математики постарались, они и виноваты. Ввели ряд определений (например, об уровнях кибернетических систем), доказали ряд теорем (например, о невозможности адекватно моделировать системы более высокого уровня с помощью систем более низкого уровня).

А чтобы еще больше запутать простых пользователей ПК, математики полезли в лингвистику. Дали определение языкам. Не рискну его здесь воспроизвести полностью, можно умереть от скуки. «А в общих чертах можно понять, о чем он говорит?» – спрашивал Иван Васильевич про пламенную речь посла шведского (а толмача сварили в кипятке перед этим, брр!). Конечно, можно…

Попробуем. Язык (по определению математиков) – это набор воспроизводимых символов средствами языка и невоспроизводимых символов средствами языка, а также набор правил вывода всех понятий языка.

Поясню. Предположим мы учим английский (чтобы потом говорить hi и bye). Можно по-английски написать эти два слова, я уже это сделал. Они записываются с помощью букв этого языка. А значит – это относится к набору воспроизводимых символов.

Но для нас, для начинающих эти символы ничего не значат, мы не знаем значения этих слов. Поэтому нам сначала говорят не по-английски, а по-русски примерно следующее: «Эти слова звучат «хай» и «бай», означают «привет» и «пока», если их произносят два джентльмена, встретившиеся утром на Бейкер-стрит».

Но ведь то, что записано в кавычках, записано без использования букв английского языка. Ну, тупые мы, начинающие юзеры английского. Нам надо сначала по-русски растолковать. Это математики и называют невоспроизводимыми символами (или короче, нетерминалами). Это такие понятия, с помощью которых можно давать описание языкам, но в самом языке отсутствуют выразительные средства, чтобы их там можно было бы воспроизвести.

Стойте! Бред какой-то. Ведь фразу, записанную в кавычках, можно перевести на английский. И, значит, она станет воспроизводимым символом (или короче, терминалом) по определению математиков. Да, согласен, если говорить о языках общения между людьми. Но машинные языки устроены, к сожалению, так, что в них средства описания структуры языка не могут быть записаны с помощью воспроизводимых символов этого языка. Вот тот-то и начинаются ПРИНЦИПИАЛЬНЫЕ отличия социальных систем высшего уровня сложности (состоящих из сообществ людей) от гораздо более примитивных человеко-машинных систем.

Хоть умри, но машине нельзя объяснить, как устроен ее машинный язык. Сам этот язык она понимает, выполняет команды этого языка. Но почему она их выполняет именно таким образом, а не иначе, она (машина) не понимает. И не поймет никогда, потому что в понимаемом ею языке нет ни слов, ни понятий, ни даже намеков на эту тему. Да и нужны ли эти понятия машине? Для надежной работы – не нужны, это точно.

Самостоятельно освоить иностранный язык

Люди же по мере освоения иностранного языка перестают нуждаться в объяснениях структуры и понятий этого языка с применением родного языка. Начиная с какого-то момента, развивать знания иностранного языка мы можем, пользуясь только этим иностранным языком.

В этом принципиальное отличие человека от машины. В этом принципиальное отличие человеческого интеллекта от программируемых устройств.

Математики, кстати, доказали (между прочим, с помощью теорем!) о недостижимости интеллекта человека машинными системами.

Разобравшись с терминалами и нетерминалами, мы легко преодолеем последнюю часть определения языка о правилах вывода (напомню определение, язык – это набор воспроизводимых символов средствами языка и невоспроизводимых символов средствами языка, а также набор правил вывода всех понятий языка – правила вывода).

Это есть то, что есть: правила вывода всех конструкций языка. И у них есть общий термин – синтаксис языка (правила написания) и семантика языка (правила употребления). Это мы знаем еще со школьной скамьи.

И что же мы имеем сухим остатком, после того, как погрузились в мир абстракций? А то, что в человеко-машинных системах, а мы только о них и говорим, так как постоянно подразумеваем человека (пользователя ПК), общающимся с машиной (персональным компьютером); в человеко-машинных системах информационные тезаурусы не только не совпадают по определению, а еще и относятся к разным классам языков, к разным уровням языков.

И между ними настолько большая разница, что

компьютер никогда невозможно научить человеческому языку, а машинные языки могут освоить только некоторые представители славного человечества (программисты, особо продвинутые пользователи и т.п.).

О фантастике, когда компьютеры общаются с людьми на равных, мы не говорим. Мы говорим о реалиях, доказанных наукой. Хотя когда-то наука уверенно доказывала, что Земля – плоская. Так что рано или поздно компьютеры все равно заговорят.

Но это уже будет совсем другая история, и совершенно иная компьютерная грамотность.

P.S. Еще почитать:

Как устроено современное информационное обеспечение. Часть 1: Процесс обмена информацией

Насколько компьютер понимает человека?

Куда подевался тот файл?

А вот и Интернет, куда без него

Как устроено современное информационное обеспечение: часть 2. Тезаурус”: 1 комментарий

  1. Наука никогда не говорила а тем более не доказывала ,что земля плоская,это твердила религия брррр.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

Имя *