При структурировании информации должна учитываться специфика потребителя полученного информационного продукта. Иными словами, полученный информационный продукт должен отвечать требованиям к уровню детализации информации, способу ее представления и составу тезауруса, обеспечивающим оптимальный режим восприятия информационного продукта.
Ранее, при рассмотрении видов моделей и методов моделирования мы установили, что уровень формализации представления знаний может изменяться в пределах от неструктурированного текста, представленного на естественном языке (ЕЯ) до структурированного текста на некотором искусственном (формальном) языке (ИЯ). Искусственные языки могут быть построены в базисе различных формальных систем (формальной логики, теоретико-множественного, алгебраического формального аппарата и иных).
В зависимости от исходного уровня структурной организации f обрабатываемых данных, могут быть выделены следующие классы
I /К 1 задач (классы задач по уровню структурной организации информации на входе/выходе):
1. Задачи преобразования неструктурированного ЕЯ-текста в ЕЯ-текст с разбиением на рубрики;
2. Задачи преобразования ЕЯ-текста с разбиением на рубрики в структурированный ЕЯ текст с элементами логического формализма;
3. Задачи преобразования структурированного ЕЯ текста с элементами логического формализма в символьную модель, использующую формализм теории графов с ЕЯ-маркировкой вершин (узлов) и связей (дуг);
4. Задачи преобразования символьной модели, использующей формализм теории графов с ЕЯ-маркировкой вершин (узлов) и связей (дуг), в символьную модель, использующую формализм теории графов с ИЯ-маркировкой вершин (узлов) и связей (дуг);
5. Задачи преобразования символьной модели, использующей формализм теории графов с ИЯ-маркировкой вершин (узлов) и связей (дуг), в строгую символьную ИЯ-модель.
В принципе, уже после решения задачи второго типа, может осуществляться переход от ЕЯ-представлений к некоторой промежуточной системе обозначений (имен), как это делается при разработке программ. Однако такой переход имеет смысл только при условии, что уже произведена декомпозиция на элементарные термины, выражающие свойства и функции объектов, с тем, чтобы в дальнейшем для них не потребовалось осуществлять процедуру восстановления ЕЯ-представления. Если это условие выполняется, то становится возможен даже автоматизированный переход от промежуточной системы имен к ИЯ-представлению (при условии существования тезауруса соответствующего уровня). В общем же случае, операция детальной декомпозиции осуществляется лишь при решении задачи четвертого типа. Впрочем, жесткий стандарт здесь установить трудно, да и не может он быть жестким, поскольку специфику алгоритма структуризации определяют цели деятельности.
Более того, в случае, когда достигнутая степень формализации не удовлетворяет требованиям, предъявляемым спецификой деятельности, полученное формальное описание может быть повторно подвергнута процедурам, которые ранее осуществлялись в отношении представления иного типа.
Заметим, что структурированию может подвергаться и /1 | рД информация, представленная в нетекстовом виде, однако и здесь могут быть выделены задачи, по своему содержанию —- равносильные перечисленным.
Например, рассматривая в качестве исходного массива данных массив графических изображений различных фрагментов некоторого объекта/процесса, относящихся к разным моментам времени и полученных с разных ракурсов, можно решить задачу структурирования, воспользовавшись теми же этапами/задачами. Для чего можно воспользоваться одной из двух стратегий:
- осуществить предварительную трансляцию в текстовую форму (составление подробных описаний изображений на ЕЯ с указанием пространственных и временных отношений между описываемыми объектами), после чего воспользоваться ранее описанными процедурами;
- интерпретировать изображение, как разновидность текста, с применением альтернативной знаковой системы, позволяющей осуществить процесс структуризации в другой знаковой системе.
В качестве теоретического основания для применения такого подхода выступает семиотика, интерпретирующая любой способ представления информации как разновидность текста, представленного средствами некоторой знаковой системы. Для графического представления информации разработан ряд методов, позволяющих перейти от обычного цветного тонального изображения к контурным и иным представлениям, упрощающим процедуры распознавания и трансляции к иным знаковым системам. Однако, поскольку графические модели, получаемые методом последовательной фиксации состояния объектов реального мира, способны отражать лишь пространственно-временные и атрибутивные характеристики наблюдаемых объектов/процессов, постольку извлечение из них системы причинноследственных отношений становится возможным только с привлечением внешней (чаще всего — экспертной) модели интерпретации.