Программы статистического анализа в историческом исследовании > Компьютерные программы обработки изображений и их применение в историческом исследовании Глобальная сеть Интернет

СОДЕРЖАНИЕ: Программа курса Историческая информатика для студентов исторического факультета / Под общ ред д-ра ист наук Л. И. Бородкина; Самарский Центр аналитической истории и исторической информатики, Самарский государственный университет. – Самара, 2000. – 15 с

САМАРСКИЙ ЦЕНТР АНАЛИТИЧЕСКОЙ ИСТОРИИ

И ИСТОРИЧЕСКОЙ ИНФОРМАТИКИ

САМАРСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

КАФЕДРА ОТЕЧЕСТВЕННОЙ ИСТОРИИ И ИСТОРИОГРАФИИ

П Р О Г Р А М М А

КУРСА ИСТОРИЧЕСКАЯ ИНФОРМАТИКА

для студентов исторического факультета

САМАРА 2000

Программа курса Историческая информатика для студентов исторического факультета / Под общ. ред. д-ра ист. наук Л.И.Бородкина; Самарский Центр аналитической истории и исторической информатики, Самарский государственный университет. – Самара, 2000. – 15 с.

Составители: к.и.н. М.В.Астахов, к.и.н. Е.Н.Филимонова

Под общей редакцией д-ра ист. наук, Президента Российской Ассоциации История и компьютер, зав. лабораторией исторической информатики МГУ Л.И.Бородкина

© Самарский Центр аналитической истории и исторической

информатики, 2000


О Г Л А В Л Е Н И Е

В в е д е н и е.............................................................................................. 4

I. Историческая информатика: предмет, задачи, основные направления развития................................................................................................ 4

II. Аппаратное и программное обеспечение исторических исследований.............................................................................................................. 5

III. Компьютерные технологии в решении задач исторического исследования........................................................................................ 5

1. Компьютерная технология работы с текстом.......................................................... 6

2. Базы и банки данных в историческом исследовании............................................. 6

3. Применение программ по обработке электронных таблиц в историческом исследовании.............................................................................................................. 8

4. Программы статистического анализа в историческом исследовании.................. 8

5. Компьютерные программы обработки изображений и их применение в историческом исследовании..................................................................................... 8

6. Глобальная сеть Интернет......................................................................................... 9

Л и т е р а т у р а.................................................................................................................. 10


В в е д е н и е

Основные тенденции развития зарубежной и отечественной исторической науки в 70-е годы ХХ века, возникновение и развитие новых исторических дисциплин. Квантитативная история как особое направление в исторической науке. Складывание предпосылок для возникновения исторической информатики: развитие вычислительной техники, развитие теории информации, возникновение машиночитаемой документации и источников. Возникновение исторической информатики в зарубежных странах в первой половине 80-х годов. Создание Международной Ассоциации История и компьютер, конституирование исторической информатики как самостоятельной исторической дисциплины.

Становление исторической информатики в России, формирование первых исследовательских центров, создание Российской Ассоциации История и компьютер.

Библиография и историография исторической информатики. Первые периодические издания по исторической информатике.

Основные зарубежные и российские исследовательские центры исторической информатики. Ведущие зарубежные и отечественные исследователи, работающие в области исторической информатики.

I. Историческая информатика: предмет, задачи, основные направления развития

Историческая информатика как продукт развития информационной культуры. Специфика исторической информатики как междисциплинарной области в системе научного знания. Место исторической информатики в системе исторических дисциплин.

Дискуссии в отечественной и зарубежной науке о предмете исторической информатики.

Основные направления развития отечественной и зарубежной исторической информатики на современном этапе. Трансформация системы отбора и хранения исторических источников в машиночитаемой форме. Первичные и вторичные (производные, интегрированные) источники. Проблемы вторичного использования машиночитаемых данных и обмена информацией. Компьютеризация основных этапов исследовательского процесса в исторической науке. Разработка компьютерных технологий в преподавании истории.

II. Аппаратное и программное обеспечение исторических исследований

Аппаратное обеспечение. Использование различных видов компьютерной техники в исторических исследованиях: персональные компьютеры, рабочие станции, мини-компьютеры, большие машины (mainframe computers). Выбор семейства компьютеров: ЕС, IBM, Pentium, и др. Вопросы архитектуры и конфигурирования компьютерной техники в целях исторического исследования. Необходимый тип процессора, требования к дискам, клавиатуре, дисплею, сканеру, принтеру.

Программное обеспечение. Проблема выбора операционной системы и операционной оболочки с учетом задач исторического исследования: MS DOS, UNIX, Norton Commander, Windows.

Общие типы прикладных программ и их назначение: текстовые процессоры и издательские системы; электронные таблицы; системы управления базами данных (СУБД) и базами знаний; статистические пакеты; системы деловой графики; средства создания и обработки графической информации; интегрированные среды; среды программирования; специальные аналитические программы; программы организации электронных коммуникаций и компьютерных сетей; программы мультимедиа; обучающие программы.

Проблема разработки специальных прикладных программ для решения специфических задач исторического исследования: контент-анализа и атрибуции текстов, палеографии, генеалогии (family reconstitution), просопографии, исследования сетевых структур (network reconstitution), истории повседневности (history of daily life), создания электронных моделей социальных процессов.

III. Компьютерные технологии в решении задач исторического исследования

Основные направления использования компьютерных технологий в исторических исследованиях: создание и обработка текстов на компьютере; создание и использование компьютерных баз и банков данных; статистическая обработка данных исторических источников с помощью компьютера; сканирование текстов и изображений, компьютеризованный анализ изобразительных источников и картографического материала; использование баз знаний и экспертных систем.

Проблемы адаптации общих прикладных программ к специфическим задачам исторического исследования. Создание и использование специализированного программного обеспечения, учитывающего особенности исторических источников.

1. Компьютерная технология работы с текстом

Понятие информации, ее структура и виды хранения. Специфика исторической информации. Понимание исторического исследования в рамках теории информации. Историк как потребитель и создатель информации. Традиционная (бумажная) технология переработки информации и ее ограниченность. Специфика работы с текстом в рамках исторического исследования: единство анализа и изложения.

Традиционные виды работы с текстом в процессе исторического исследования: прочитывание, выписывание, систематизация выписок, написание основы текста, редактирование текста (перекомпоновка текста, аналитическое и стилистическое редактирование), оформление текста в соответствии с академическими и полиграфическими требованиями.

Трансформация основных видов работы с текстом в рамках компьютерной технологии: сканирование текста, систематизация сканированных нарративных источников и исторических исследований в файловой форме и каталогизация файлов; создание основы текста на базе сканированных источников и литературы; аналитическая переработка и стилистическое редактирование текста; оформление текста в соответствии с академическими и полиграфическими требованиями; микротиражирование окончательного текста исследования.

Современные текстовые процессоры и их возможности. Выбор вида текстового процессора с учетом специфики исторического исследования. Lexicon, WordPerfect, Word и их версии. Возможности и ограничения.

TACT - система анализа текстов. Индексирование. Конкордансы. Категоризация. Описание структуры текста. Контекстный поиск по структурным элементам. Обработка разночтений, выявление фонетически близких единиц текста. Применение ТАСТа в контент-анализе и информационном поиске.

2. Базы и банки данных в историческом исследовании

Базы данных как вид хранения информации в электронной форме. Системы управления базами данных (СУБД). Стандартные пакеты СУБД, ориентированные на персональные компьютеры: dBASE, Paradox, FoxPro и т.д. Основные модели данных: сетевые, иерархические, реляционные. Понятие о реляционной модели данных как о наборе взаимосвязанных таблиц. Понятие о ключевых полях - идентификаторах, однозначно соответствующих отдельным объектам.

Моделирование исторических данных: структурная сложность исторической информации; ограничения, накладываемые стандартным программным обеспечением; структура базы данных как модель источника; модель данных и исследовательская задача; методо-ориентированный и источнико-ориентированный подходы к моделированию исторических данных; проблема неточности и неполноты исторических данных; контекстная зависимость, временная и географическая обусловленность; информация источника и экспертное знание.

Специализированные банки машиночитаемых исторических источников. Структурированные (жестко структурированные) данные в исторических источниках (highly structured historical data). Понятие о двух подходах к созданию машиночитаемого исторического источника - архивном и исследовательском. Проблемы разработки стандартов описания и документирования машиночитаемых источников. Защита авторских прав создателей машиночитаемых источников.

Технологии создания машиночитаемых версий источников: маркирование (markup) текста; заполнение готовых форм баз данных; база данных как транскрипция источника.

CensSys - система представления и анализа структурированных источников. CensSys как средство хранения и анализа первичных материалов переписей населения. Возможности CensSys как базы данных. Средства стандартизации и кодирования информации. Статистические возможности CensSys.

SOCRATES - специализированная надстройка СУБД DBase IV. Достоинства и недостатки реляционной модели данных. Группировка данных. Обработка пропущенных данных. Работа с неструктурированным текстом. Источник нерегулярной структуры как наложение нескольких регулярных структур. Построение специальных программных средств с помощью системы SOCRATES: - создание средств ввода данных, ввод полного текста данных и его обработка.

KLEIO - система обработки данных исторических источников. Структура базы данных: информационные группы и элементарная информация; иерархия групп, многозначные поля, поле комментария и поле оригинала, организация полнотекстовых баз данных, специальные типы данных; интеграция картографической и изобразительной информации. Механизм интерпретации: описание и хранение гипотез, логические объекты, связь между логическими объектами и исходными данными. Специальные процедуры: обработка календарных дат, денежных единиц, мер, весов и т.п.; правила замены недостающих данных; правила обработки разночтений; лингвистические процедуры (лемматизация, индексирование); построение тезаурусов. База данных как электронная публикация источника. Средства форматирования текста базы данных.

StanFEP - средство преобразования форматов описания данных. Преобразование маркированного текста в базу данных. Обмен данными между системами, поддерживающими разные модели данных.

3. Применение программ по обработке электронных таблиц в историческом исследовании

Возможности применения программ по обработке электронных таблиц в историко-статистическом исследовании.

Особенности современных электронных таблиц Lotus 1-2-3 (Lotus Development Corporation), Quattro Pro (Borland International), SuperCalc 5 (Computer Associates Inc.), Excel (Microsoft). Проблема выбора программы по обработке электронных таблиц с учетом задач исторического исследования.

4. Программы статистического анализа в историческом исследовании

Общие сведения о прикладных пакетах статистического анализа. Методы анализа качественных признаков: таблицы сопряженности, коэффициенты связи. Методы дескриптивной статистики (средние величины, меры вариации). Построение статистически корректной выборки. Вычисление выборочных характеристик. Методы анализа статистических связей: корреляционный анализ, регрессионный анализ. Методы многомерного статистического анализа: факторный анализ, кластер-анализ, многомерное шкалирование. Методы анализа динамических рядов. Решение на компьютере практических задач статистического анализа данных исторических источников.

5. Компьютерные программы обработки изображений и их применение в историческом исследовании

Области использования графической информации в историческом исследовании. Особенности графической информации. Представление графической информации в цифровом виде (digitized image). Банки изображений. Системы мультимедиа.

Ввод графической информации в компьютер. Ввод изображений и текстов со сканера. Различие между представлением текстовых источников в графическом и текстовом виде. Оптическое распознавание текстов (OCR). Программное обеспечение OCR.

Возможности создания изображений, комментирующих текст исторического исследования, в графическом редакторе и специализированных программных системах. Интеграция изображений с текстами в издательских системах.

Новые возможности использования изобразительных исторических источников. Использование изобразительных источников в базах данных. Компьютерный анализ изображения.

Проблемы компьютерного исторического картографирования. Особенности картографической информации. Представление картографической информации. Ввод контурных изображений (карт и т.п.) через дигитайзер. Использование картографической информации в статистических пакетах. Специализированные системы компьютерной картографии (mapping systems). Географические информационные системы (GIS).

6. Глобальная сеть Интернет

Назначение сети Интернет. Интернет – глобальная компьютерная сеть, объединяющая различные сети, взаимосвязанные с помощью специальных программ (протоколов).

Основные возможности сети Интернет. Telnet – программа удаленного доступа к ресурсам Интернета, предоставляющая пользователю возможность работать с библиотечными каталогами, базами данных и прочими информационными ресурсами. Электронная почта – средство посылать сообщения, получать их в свой электронный почтовый ящик, а также рассылать копии писем сразу нескольким получателям. Телеконференции. Сеть USENET – средство передачи и ведения телеконференций. Характеристика категорий телеконференций. WORLD WIDE WEB – концепция универсальной глобальной информационной системы.

Понятие гипертекста. Гипертекстовые системы – новый класс систем управления информационными ресурсами (текстами, файлами, рисунками, звуками, подвижными изображениями и т.п.)

Броузеры – программы, позволяющие ориентироваться в сети, обеспечивающие сетевое соединение и отображающие гипертекстовые документы.

Поисковые системы, позволяющие проводить навигацию в сети, искать нужную информацию по ключевым словам (Yahoo, Lycos, Alta Vista и др.)

Домашние странички, Web-сайты.

Новые информационные ресурсы Интернета для историков. Обзор полезных Web-сайтов, содержащих информацию для специалистов по отечественной и зарубежной истории.


Л И Т Е Р А Т У Р А

Общие вопросы информатики

Ботт Э. Microsoft Office 4. М., 1996.

Брябрин В.М. Программное обеспечение персональных ЭВМ. М.: Наука, 1990.

Глушков В.М. Основы безбумажной информатики. М.: Наука, 1982.

Гончаренко В.В., Шингарева Е.А. Фреймы для распознавания смысла текста. Кишинев, 1984.

Информатика. Энциклопедический словарь для начинающих. М., 1994

Катаев А.И. Текстовый процессор ЛЕКСИКОН. М.: Радио и связь, 1992.

Компьютер и историческое знание. Международный сборник научных трудов. Барнаул: Изд-во Алтайского гос. ун-та, 1994.

Когаловский М.Р. Технология баз данных на персональных ЭВМ. М.: Финансы и статистика, 1992.

Крамм Р. dBASE II и dBASE III - системы управления базами данных для персональных ЭВМ. М., 1988.

Куправа Т.А. Создание и программирование баз данных средствами СУБД dBASE III Plus, FoxBase Plus, Clipper. М.,1991.

Левин Р., Дранг Д., Эделсон Б. Практическое введение в технологию искусственного интеллекта и экспертных систем. М.: Финансы и статистика, 1991.

MS-DOS 6.0. Справочное руководство для пользователей компьютеров IBM-PC. М., 1994.

От WINDOWS 3.1 к WINDOWS 95 за один день. СПб., 1996.

Ракитов А.И. Компьютерная революция и информатизация общества // Философские науки. 1988. № 5.

Ракитов А.И. Компьютерная революция: наука, экономика, технология. М., 1993.

Ратбон Э. WINDOWS 95. Киев, 1996.

Ресурсы Microsoft. Windows NT. Wokstation 4.0. СПб., 1998.

Тюрин Ю.Н., Макаров А.А. Анализ данных на компьютере. М., 1995.

Фанештих К., Хаселир Р. Операционная среда WINDOWS 3.1. Практическое пособие. М., 1994.

Фигурнов В.Э. IBM PC для пользователя. М., 1992. Хижняк П.Л. Lotus 1-2-3 (справочное руководство). М.: АПН, 1990.

Четвериков В.Н., Ревунков Г.И., Самохвалов Э.Н. Базы и банки данных. М.: Высшая школа, 1987.

Johnson-Laird P.N. The Computer and the mind. An Introduction to Cognitive science. Cambridge, 1988.

Информатика и гуманитарные исследования

Бешенков С.А., Гейн А.Г., Григорьев С.Г. Информатика и информационные технологии. Учебное пособие для гуманитарных ф-тов университетов и пед. институтов. Екатеринбург, 1995.

Громов Г.Р. Гуманитарные основы информатики. М.,1988.

Громов Г.Р. Очерки информационной технологии. М., 1993.

Информатика и культура. Новосибирск, 1990.

Кент П. Internet. М., 1996.

Компьютер и экономическая история. Барнаул, 1997.

Рассолов М.М., Элькин В.Д., Рассолов И.М. Правовая информатика. М., 1996.

Скрипкин К.Г. Финансовая информатика. Учебное пособие. М., 1997.

Урсул А.Д. Социальная информатика: две концепции развития // Научно-техническая информация. Серия 1. 1990. № 1.

Computers and the humanities. Ed. Jean-Philipp Genet and Antonio Zampolli. Oxford, 1992.

Philosophy and the computer. Ed. Leslie Burkholder. Oxford, 1992.

Историческая информатика

Базы данных России. Каталог. М., 1993.

Белова Е.Б., Бородкин Л.И., Гарскова И.М., Изместьева Т.Ф., Лазарев В.В. Историческая информатика. М., 1996.

Бородкин Л.И. Историческая информатика в развитии: методологические аспекты // Круг идей: модели и технологии исторической информатики. М., 1996.

Бородкин Л.И. Историческая информатика: этапы развития // Новая и новейшая история. 1996. № 1.

Владимиров В.Н. История, карта, компьютер // Круг идей: модели и технологии исторической информатики. М., 1996.

Владимиров В.Н., Колдаков Д.В., Силина И.Г., Токарев В.В. Пространственные аспекты истории Алтая. Значение компьютерного картографирования // Круг идей: традиции и тенденции исторической информатики. М., 1997.

Владимиров В.Н. Интернет для историка: глобальная информационная игрушка или новая парадигма? // Информационный бюллетень История и компьютер. 1996. № 20.

Владимиров В.Н., Бородкин Л.И. Интернет для историка: новая парадигма в действии // Информационный бюллетень История и компьютер. 1997. № 21.

Гарскова И.М. Базы и банки данных в исторических исследованиях. Изд-во Konrad Pachnicke. Gettingen, 1994.

Гутнов Д.А., Перевертень В.А. Просопографическая информационная система Просис: версия 2.0 // Информационный бюллетень История и компьютер . 1994. № 10.

Доорн П. Анализ временных рядов в историческом исследовании: потенциал пакетов SAS и SPSS // История, статистика, информатика. Материалы научного семинара Статистическое программное обеспечение для историков. Барнаул, 1995.

Доорн П. Электронный лабиринт: возможности и ловушки компьютерной системы Интернет для историков // Круг идей: развитие исторической информатики. М., 1995.

Информационный Бюллетень Комиссии по применению математических методов и ЭВМ при отделении истории РАН и Ассоциации История и компьютер. М.: МГУ. 1990-1994. № 1-12.

Информационный бюллетень История и компьютер. М., 1993-2000.

История. Источник. Компьютер. Традиционное и компьютерное источниковедение. Барнаул, 1996.

История и компьютер: Новые информационные технологии в исторических исследованиях и образовании / Отв. ред. Л.Бородкин и В.Леверманн. Геттинген, 1993.

История, статистика, информатика. Материалы международного семинара Статистическое и программное обеспечение для историков. Барнаул, 1995.

Киселев И.Н. Информационные технологии в архивном деле (по материалам XIII Международного конгресса) // Информационный бюллетень История и компьютер. 1997. № 20.

Кляцкин В.М., Щепин Е.В., Зингерман К.М., Лазарев В.В. Структурные методы распознавания сложноорганизованных исторических табличных форм // Круг идей: модели и технологии исторической информатики. М., 1995.

Ковальченко И.Д., Бородкин Л.И. Информатика и вычислительная техника в источниковедении // Проблемы количественных методов анализа и классификации источников по отечественной истории. Днепропетровск: ДГУ, 1988.

Когаловский М.Р. Технология баз данных на персональных ЭВМ. М., 1992.

Круг идей: новое в исторической информатике. М., 1994.

Круг идей; развитие исторической информатики. М., 1995.

Круг идей: модели и технологии исторической информатики. М., 1996.

Круг идей: традиции и тенденции исторической информатики. М., 1996.

Круг идей: Традиции и тенденции исторической информатики. М., 1997.

Круг идей: историческая информатика на пороге XXI века. М., 1999.

Моисеенко Т.Л. Создание банков информации в исторической науке (Научно - аналитический обзор). М.: ИНИНОН, 1990.

Пиотух Н.В. О возможностях компьютерного картографирования при работе с данными писцовых книг начала XVII в. и материалами генерального межевания второй половины XVIII века // Круг идей: модели и технологии исторической информатики. М., 1996.

Таллер М. Что такое источнико-ориентированная обработка данных и что такое историческая информатика // История и компьютер: новые информационные технологии в исторических исследованиях и образовании. Геттинген, 1993.

Тяжельникова В.С., Леверманн В. Источнико-ориентированная обработка данных. KLEIO: руководство для пользователя. М., 1995.

Шаров Ю. Введение в базы данных. М., 1995.

ЭВМ и математические методы в исторических исследованиях. Отв. ред. Ю.П.Бокарев. М., 1993.

Юмашева Ю.Ю. История, музеи, архивы. Взгляд с помощью multimedia // Круг идей: модели и технологии исторической информатики. М., 1996.

Юшин И.Ф. Социальные классификации и изучение социальной политики на основе KLEIO-модели источника // Круг идей: модели и технологии исторической информатики. М., 1996.

A Guide to Historical Datafiles Held in Machine-Readable

Form. Compiled by K.Schurer and S.J.Anderson. London: Association for History Computing, 1992.

Computer applications for anthropologists. Ed. Margaret

S.Boone, John J.Wood Belmont. California, 1992.

Electronic Information Resourses and Historians: European Perspectives. Eds. S.Ross, E.Higgs. Gettingen, 1993.

Gross G. Eine Einfurung in die Menunsterung. Gottingen: Max-Planck-Institut fur Geschichte, 1992.

Histoire et informatique. Actes du Congres Monpellier Computer Conference 1990. Ed. Josef Smets. Monpellier, 1992.

Image and Manuscripts in Historical Computing. Ed. Manfred Thaller. St.Katharinen, 1993.

Mawdsley E., Munck T. Computing for Historians. An introductory guide. Manchester-New York: Manchester University Press, 1993.

Optical Character Recognition in the Historical Discipline. Eds. P.Doorn et al. Gettingen, 1993.

Storia Multimedia. Proceedings of the Seventh International Congress. Association for History Computing. Ed.

F.Bocchi P.Denley. Grafis Edizioni, 1994.

Thaller M. Kleio 4: Ein Datenbanksystem. St.Katharinen, 1992.

The Art of Communucation. Abstracts VIII International AHC - Conference. Ed. G.Jaritz, I.Kropac, P.Teibenbacher. History Computing. Austria. 1993.

The Use of Occupations in Historical Analysis. Eds.

K.Schurer and H.Diederiks. Gettingen, 1993.

Информационные технологии в преподавании гуманитарных

и исторических дисциплин

Применение компьютерной техники в преподавании общественных наук. Всесоюзный семинар с междунар. участием (Ленинград, 1990). Л., 1990.

Использование электронно-вычислительной техники в подготовке учителей истории и обществоведения: Метод. рекомендации. М., 1986.

Минский М. Фреймы для представления знаний. М., 1979.

Новые информационные ресурсы и технологии в исторических исследованиях и образовании. М., 2000


Учебно-методическое пособие

Астахов Михаил Викторович

Филимонова Елена Николаевна

Программа курса Историческая информатика для студентов исторического факультета

Редактор Е.Н. Филимонова

Компьютерная верстка, макет – М.В. Астахов

ЛР № 020316 от 04.12.96. Подписано в печать 26.06.2000. Формат 60х84/16. Оперативная печать. Бумага офсетная. Объем 0,94 усл. печ. л. Тираж 100 экз.

Заказ № 186

Самарский Центр аналитической истории и исторической информатики. 443010, г. Самара, ул.Галактионовская, 56

Скачать архив с текстом документа