文字情報

knagasaki2017/10/11 (水) - 12:40 に投稿

デジタル文化資料における文字の扱いに関しては、実に色々な難しさがあります。「文字」とは何か、文字は何によって成立しているのか、ということについては、デジタル情報の、文脈やコミュニティを超えた膨大かつ一元的な蓄積のおかげで、改めて問い直されなければならない状況になっております。その状況を踏えつつ、便利なツールとしては以下のものをご紹介しておきます。

CHISE - CHISE IDS 漢字検索

GlyphWiki

漢字異体字データベース

Unicode

画像とアノテーション

knagasaki2017/10/11 (水) - 02:25 に投稿

画像とアノテーションを扱う際には、近年はIIIF (International Image Interoperability Framework) を用いるのが有力な手段です。IIIF規格に従ってコンテンツを公開すると、フリーソフトとして開発公開されている様々なビューワで表示できて構築にかかるコストを低減できるだけでなく、そのようにして公開された各地のIIIF対応コンテンツを統一的に扱って仮想コレクションを作ったりすることもできます。IIIFに関しては、「IIIFに関する日本語情報の私的なまとめ」もご覧ください。

IIIF対応ビューワ

Mirador

Universal Viewer

Leaflet-IIIF

Omeka 2.5.1、Neatline、IIIF Toolkit のインストール

knagasaki2017/10/11 (水) - 01:37 に投稿

Omeka 2.5.1をインストールしてみます。すでにmysql, php, apacheはインストールされているLinux環境を前提にしています。

 

まずは、omeka用のデータベースをmysqlで作成します。

$ mysql -u root -p

(ここでrootのパスワードが未設定ならそのままEnter。)

omkyangというデータベースを作ってみます。

mysql> create database omkyang default character set utf8 collate utf8_unicode_ci;

データベースができたかどうか確認してみます。

mysql> show create database omkyang;

データベースがWebから書き込めるようにしつつ、パスワードも設定しておきます。
 

mysql> grant all privileges on omkyang.* to ifomkut_user identified by 'データベースomkyangのユーザifomkut_user のパスワード'

 

テクスト分析

knagasaki2017/10/04 (水) - 02:22 に投稿

テクスト分析ツール(日本語で使えるもの)

立命館大学の樋口耕一先生によるフリーソフトウェア。様々な分析が簡単にできるようになっている上に、単語をグルーピングして分析できる「コーディング」機能が秀逸です。既存の著名なツールの組み合わせによって作られていますので応用可能性も高いです。 詳しくは『社会調査のための計量テキスト分析』をご覧ください。

時空間情報

knagasaki2017/10/04 (水) - 02:18 に投稿

時空間情報を手元で扱ってみる:

HuTime

時間に基づいて情報の可視化や解析を行う時間情報解析ソフトウェア。

曆変換のためのシステムとLinked Data「時間基盤情報」も提供されています。

「地図の閲覧ソフトで見たい範囲を移動したり拡大・縮小したりできるように、HuTimeでも時間軸上の見たい範囲を自由に移動したり拡大・縮小したりすることができます。この機能により、1日、1時間の詳細な情報から1年、世紀をまたぐような長期間に渡る情報までを1つの年表や時系列グラフに含めることができます。表示する時間範囲を拡げて俯瞰することで、どの時間範囲に情報が集中しているのか、どのあたりの変化が大きいのかといった情報の全体像を把握しながら、特定の時間範囲に絞り込んで具体的には何がどのように起きているのかを検証することが可能になります。」(「HuTimeにできること」より)