Метаданные
СОДЕРЖАНИЕ: Различие между данными и метаданными, их классификация и структура. Роль и использование метаданных, проблемы их стандартизации и формат. Принципы, определяющие политику в области метаданных в перспективных информационных системах в публичном интернете.федеральное агентство по образованию
Исторический факультет
Кафедра документоведения
метаданные
Реферат
Научный руководитель:
Субботин П.Ю.
БЕЛГОРОД 2010
Содержание
Определение
Различие между данными и метаданными
Классификация и структура метаданных
Роль метаданных
Проблемы стандартизации метаданных
Формат метаданных
Библиографический список
Определение
Метаданные (от греч. Meta и лат. Data), буквально переводится как «данные о данных», информация о другом наборе данных.
1. Метаданные — это структурированные, кодированные данные, которые описывают характеристики объектов-носителей информации, способствующие идентификации, обнаружению, оценке и управлению этими объектами.
2. Метаданные (Майкл Брэкет) – любые данные об информационных ресурсах организации».
3. Метаданные (Адриен Танненбаум) – детальное описание сущности данных.
4. Метаданные – это данные о данных, информация об информации, описание контента.
Различие между данными и метаданными
Обычно невозможно провести однозначное разделение на данные и метаданные в документе, поскольку:
1. что-то может являться как данными, так и метаданными. Так, заголовок статьи можно одновременно отнести как к метаданным (как элемент метаданных — заголовок), так и к собственно данным (поскольку заголовок является частью самого текста).
2. данные и метаданные могут меняться ролями. На стихотворение, рассматриваемое как данные, может быть написана музыка, в этом случае всё стихотворение может быть «прикреплено» к музыкальному файлу и в этом случае рассматриваться как метаданные. Таким образом, отнесение к одной или другой категории зависит от точки зрения (или пространства имён, системы отсчёта).
Классификация и структура метаданных
Существуют различные классификации метаданных, отличающиеся между собой, главным образом, степенью детализации. Две большие группы:
1. Метаданные описания контента. Контентные метаданные охватывают описание всех аспектов данного информационного объекта, как отдельной сущности. Иногда их дополнительно подразделяют на структурные и описательные.
2. Административные метаданные. Административные метаданные объединяют различные группы и отличаются большим разнообразием. Например, они позволяют владельцу ресурса проводить четкую и гибкую политику в отношении информационного объекта, включая авторизацию, аутентификацию, управление авторскими правами, доступом, а также служат для идентификации и категоризации объектов в рамках специальной коллекции или организации. Метаданные для архивирования могут включать в себя не только метаданные, необходимые для нахождения ресурсов, возможные правила и условия доступа и т.д., но и периоды времени для классифицированной информации, информацию об открытом или закрытом хранении, данные об использовании, историю миграции с одной объединение аппаратной платформы на другую и т.д. Другая группа административных метаданных может использоваться для позиционирования данного информационного ресурса в контексте группы подобных документов, информационно-поисковой системы, предметной области и т.д. Существует группа административных метаданных, которые можно назвать «техническими» . В качестве примера можно назвать схемы хранения данных в базах данных, схемы распределенных баз данных и др. Наконец, метаданные можно использовать для «кодирования» содержательной информации о том, для каких групп пользователей предназначен ресурс, для ориентирования пользователей относительно его философского, мировоззренческого смысла (т.е. метаданные будут содержать сравнительную и оценочную компоненты, призванные помочь пользователю «встроить» данную информацию в структуру его миропонимания).
Метаданные состоят из элементов, объединенных в наборы. Широко известным примером набора элементов метаданных является т.н. Дублинское ядро (Dublin Core, DC). Такие наборы разрабатываются с различными целями (например, для описания различных информационных объектов) различными организациями, которые предпринимают в случае целесообразности усилия по распространению и стандартизации своих разработок. В том случае, если набор элементов метаданных рассматривается и принимается соответствующей уполномоченной организацией (например, International Standart Organisation, ISO), он становится официальным стандартом метаданных.
Необходимо подчеркнуть, что реальные наборы метаданных обычно содержат элементы как контентных, так и административных метаданных. Т.е. необходимо понимать, что вышеприведенное разделение вполне условное, хотя есть несколько специализированных наборов именно для целей администрирования.
Роль метаданных
метаданные информационный стандартизация интернет
Метаданные – понятие исключительно широкое и емкое. Данный обзор ориентирован прежде всего на пользователей и создателей электронных информационных ресурсов. Применительно к этой области применения, роль метаданных об электронных ресурсах, прежде всего, состоит в:
предоставлении возможностей более быстрого, точного и полного обнаружения необходимых ресурсов;
обеспечении гибких и разнообразных механизмов отбора в соответствии с требованиями пользователя (поисковым запросом);
предоставлении информации о необходимых требованиях к возможностям использования (требуемое прикладное программное обеспечение, свободное дисковое пространство и т.п.);
управлении жизненным циклом информационных ресурсов (создания, использования и храненения цифровых документов).
Метаданные способны ускорить процесс международного доступа к информации, т.к. могут быть представлены на языках, отличных от языка объекта.
Возможности использования метаданных исключительно широки и еще до конца не осознанны. Например, метаданные можно использовать для объединения и оценки электронных объектов в рамках обучающих ситуаций. Можно предположить, что роль метаданных для учебных материалов, а также метаданных для документов, которые, по мнению пользователя, могут быть интегрированы в образовательный процесс, будет постоянно возрастать. Рабочая группа по разработке образовательных элементов набора метаданных занимается определением дополнительных элементов и квалификаторов в конкретных областях.
Проблемы стандартизации метаданных
Электронные информационные ресурсы интернета в целом и различных информационных систем в частности различаются исключительным разнообразием. Поэтому единственное средство описания метаданных не может удовлетворить все потребности и решить все возникающие задачи. Кроме этого, даже если такой универсальный стандарт и был бы разработан и утвержден, нет возможности добиться его неуклонного выполнения всеми создателями информационных ресурсов. Затем, возникает сложный многофакторный выбор, т.к. подобный стандарт неизбежно будет исключительно сложным и громоздким, что влечет большие затраты на его имплементацию, поддержку, сопровождение, обучение персонала и т.п. Другой аспект связан с тем, что значительная часть ресурсов в сети создается непрофессионалами, которые и не могут, и не хотят вникать в сложные правила генерации метаданных различных типов. Исходя из сказанного, можно предложить ряд принципов, определяющих политику в области метаданных в перспективных информационных системах (ИС) в публичном интернете (например, электронных библиотеках):
поддерживать несколько наборов метаданных, заведомо покрывающих все перспективные потребности ИС;
обеспечить отображение всех наборов в один, принятый за стандарт обмена;
хранить все метаданные в центральном каталоге метаданных;
если создателю коллекции или ИС необходим оригинальный набор элементов метаданных, то на нем лежит ответственность за разработку методов его отображения в один из распространенных стандартов.
Метаданные на уровне коллекций и ИС оправданно создавать с участием профессионалов в данной предметной области, а на уровне объектов (документов) метаданные желательно генерировать автоматически, для чего требуется разработка или использование соответствующего программного обеспечения.
При этом в каталоге метаданных могут храниться записи:
на уровне коллекции (содержание, предназначение, протоколы, форматы, наборы, условия доступа) – созданные специалистами в наборе элементов, принятом за стандарт обмена (например, Дублинское ядро);
на уровне объекта (документа, item) – в одном из поддерживаемых данной ИС стандартов метаданных;
нормализованные записи на уровне объектов – отражение оригинального набора элементов метаданных в некоторый формат обмена.
Формат метаданных
Метаданными на практике обычно называют данные, представленные в соответствии с одним из форматов метаданных.
Формат метаданных — представляет собой стандарт, предназначенный для формального описания некоторой категории ресурсов (объектов, сущностей и т. П.). Такой стандарт обычно включает в себя набор полей (атрибутов, свойств, элементов метаданных), позволяющих характеризовать рассматриваемый объект. Например, формат MARC позволяет описывать книги (и не только книги), содержит поля для описания названия, автора, тематики и огромного множества других характеристик (формат MARC позволяет описать сотни характеристик).
Форматы можно классифицировать, во-первых, по охвату и подробности типов описываемых ресурсов. Во-вторых, по ширине и подробности области описания ресурсов и мощности структуры элементов метаданных. Кроме этого, можно классифицировать по предметным областям, или целям разработки и использования формата метаданных.
Форматы метаданных часто разрабатываются международными организациями, включающими в себя заинтересованные в появлении стандарта государственные организации и частные компании. Разработанный формат часто закрепляется как стандарт в одной или нескольких организациях, занимающихся разработкой и принятием стандартов.
Библиографический список
1. http://www.elbib.ru/index.phtml?page=elbib/rus/methodology/md_rev/md_def
2. http://slovari.yandex.ru/~книги/Естественные%20науки/Метаданные./
3. http://ru.wikipedia.org/wiki/Метаданные
4. http://www.knowbase.ru/definitions/metadata.htm
5. http://www.iso.ru/journal/articles/450.html