日記帳

アクセスカウンタ

zoom RSS オントロジーについての抜粋

  作成日時 : 2013/10/07 14:46   >>

なるほど(納得、参考になった、ヘー) ブログ気持玉 2 / トラックバック 0 / コメント 0

「障害者虐待とその原因について」という投稿で、法文の記述に関して、オントロジーを考慮するべきことを指摘しましたので、「オントロジー」に関する資料に基づいて抜粋を書きました。

オントロジー
オントロジー(英: ontology)は、哲学用語で存在論のこと。ものの存在自身に関する探究、あるいはシステムや理論の背後にある存在に関する仮定という意味である。これから派生して情報科学等でも用いられる。

情報科学
人工知能分野をはじめとするコンピュータの世界では、「概念化の明示的な仕様」と定義されることがある。
ウェブをはじめとした文書検索において、従来の方法では単語単位での一致か、よくても類義語を含む文書を検索するのが限度であった。ここにオントロジーの概念を導入する。それぞれの文書の内容を説明する意味情報(メタデータ)を各文書に付加し、メタデータを記述する用語を定義する構造を構築する。この構造がオントロジーとなる。
オントロジーを導入することにより、検索対象となる文書が単なる単語の集まりとしてではなく、文書全体で大きな意味を持ったデータとして扱われ、各文書について統一的な付加情報をもたせることができる。これにより、本当に必要な情報を的確に検索することが可能となる。
このように、メタデータとオントロジーの技術を用い、文書の意味に即した処理を計算機が行うことが出来るウェブをセマンティックウェブと呼び、次世代の検索技術が実現されることなどで期待されている。

バイオインフォマティクス
さらに上記から派生した意味で、バイオインフォマティクスでも、概念・用語の明示的な仕様のことをいう。
生物学では異なる分野(例えば対象とする生物種が違う)で同じ用語を異なる意味に用いることがあり、また遺伝子の相同性が高いからといって同じカテゴリの遺伝子とみなしてよいとも限らない。このあたりを明確化し、将来的にはテキストマイニングなどを用いて自動的に新たな知識を抽出することを目的として遺伝子オントロジープロジェクトが進められている。これは上位概念として生物学・医学関係全般を対象としたオントロジーの一部に位置づけられている。

存在論
存在論(そんざいろん、英: ontology、独: Ontologie)は、哲学の一部門。さまざまに存在するもの(存在者)の個別の性質を問うのではなく、存在者を存在させる存在なるものの意味や根本規定について取り組むもので、形而上学ないしその一分野とされ、認識論と並ぶ哲学の主要分野でもある。
「存在論」の原語は、ドイツ語でOntologie、ラテン語でontologiaであるが、この表現はギリシア語で「存在するもの」(存在者)を意味する「オン」(on)と「理論」を意味する「ロゴス」(logos)を結んで、17世紀初頭ドイツのアリストテレス主義者ルドルフ・ゴクレニウス によって作られたものである[1]。その後、ヨハン・クラウベルクを経て、クリスティアン・ヴォルフに至り用語として定着した[1]。日本では、1870年に西周がヴォルフのOntologieを「理体学」と訳したのが最初であり、以後、「実体学」、「本体論」、「実有論」などさまざまに訳され、1930年後半以降に入り「存在論」の訳語が定着し、一般にハイデガーのOntologieに対する訳語として用いられることになった。
存在論の歴史は古代ギリシアに遡る。ことにアリストテレスの第一哲学は存在への問いを明確に立てたものであり、以後の西洋哲学の中心は近代に至るまで存在論が占めてきた。
カント以降の哲学は、認識論への傾倒をみせるが、第一次世界大戦後の19世紀の末からニコライ・ハルトマンの批判的存在論や マルティン・ハイデッガーの基礎的存在論などによって「認識論から存在論へ」というモットーのもとに復活をみせるようになった。
カント以降の哲学は認識論への傾倒をみせたが、19世紀の末から第一次世界大戦後の存在論は、「認識論から存在論へ」というモットーのもとに復活をみせる。
エトムント・フッサールは、デカルト的な主観・客観の2項対立図式を乗り越えたノエシス/ノエマ構造を本質とする志向性意識についての認識論的考察と、志向対象としての存在者への考察を現象学的還元を介して批判的に記述することにより、限定的ながらも存在論への道を開いた。もっとも、フッサールの存在論はあくまで認識論の範囲内でのものであり、その限りで消極的なものである。
ウィーン学団から始まった論理実証主義は、けっして一つの主張で固まっていたわけではないものの、経験主義を基礎に実在論を主張するものが多くいた。そして、経験主義の伝統においては、真理とは、観念と実在の対応であり、その場合の観念とは、一つの名辞を単位に考えられていた。カルナップらの論理実証主義は、この単位を一つの言明に置き換えた。つまり、ここでは、直接的経験によるセンス・データ(感覚所与)言語に翻訳可能であれば、この言明は有意味であると考えられたのである。
しかしながら、ウィラード・ヴァン・オーマン・クワインによれば、このように実在と観念の対応を一つの名辞、一つの言明に分解していく還元主義は不可能であり、われわれの認識は一つの言語体系であり、したがって、とある信念を検証するにあたっては、一つの理論の全体との関係で、経験の審判を仰がねばならず、そのコロラリーとして、分析的真理と総合的真理は区別することはできないのである。クワインは、これを「全体論」と呼んだが、これによれば、経験による改訂の可能性を原理的に免責されている信念はなく、もし対立する二つの理論があるときは、どのような経験によっても、そのどちらかが完全に否定されることはなく、どのような信念でも保持しつづけることができることになる。
論理実証主義は、哲学に数学、論理学を基礎とした確固たる方法論を基盤に実験や言語分析に科学的な厳正さを求め、存在論を含め形而上学的問題を哲学的に無意味なものと見なしたのであるが、クワインの批判をきっかけに反論が強まり、哲学的に失敗したものとみなされるようになった。現在では「分析的形而上学」と呼ばれる分野で、存在論だけでなく、時間・自由など伝統的な形而上学的なトピックのほぼすべてについて分析哲学の手法を用いた議論がなされているといってよい。
ドイツでは、戦後しばらくの間はハイデッガーが学派とまではいえないにせよ一定の影響力を持っていたが、1960年ころから、いわゆる「ドイツ社会学の実証主義論争」を経て、英米系の言語哲学、科学哲学、現代的認識論の発展の成果を受容する流れがドイツ哲学会では強くなり、ハイデガーの影響力は減退していった。
経験論、プラグマティズムの伝統の下、論理実証主義、分析哲学が発展し、形而上学を否定する傾向のある英米系の哲学では、特にハイデッガーを評価する向きは少ないようであるが、近年、存在論も含め形而上学的な問題がやや形を変えた形で議論され、分析的形而上学と呼ばれている。英米系の哲学では、クワインの主張が以後の存在論の流れを方向付けた。存在論は認識論と同様自然化されなければならないとされ、いわゆる存在論的問題は自然科学によって解答が与えられるべきものであり、そのプロジェクトは科学者が共同して遂行していくものとのされたのである。そこでは、専門訓練を受けた科学者が、それぞれの専門分野で、物理学の哲学、生物学の哲学といった個別の分野ごとに存在論的問題を論じていくことになる。それでは存在論は単に科学の一章にすぎないのであろうか、それともやはり哲学固有の問題は残り続けるのであろうか。この点はついては、現在も肯否両論の立場から議論が続けられており、その解決は未来に残された問題といえるだろう。
コンピュータ科学と情報科学において、オントロジー(概念体系)は、あるドメイン内の概念とそれらの概念間の関係のセットとしての知識の形式的な表現である。そのドメイン内のエンティティ(実体)についての理由付として使われる。哲学用語の(オントロジー)とは大きく異なる。
理論上、概念体系は『公式な、共有される概念化の明示的仕様』[1]です 。オントロジーは、あるドメインをモデル化するため使われる、すなわちそこに存在するオブジェクトや概念のタイプとそれらの特性や関係の、共有される語彙を提供する[2]。
オントロジーは、情報を組織化する構造的フレームワークであり、世界またはその一部についての知識表現の形として、人工知能、セマンティックWeb、システム工学、ソフトウエア工学、バイオメディカルインフォマティクス、ライブラリ科学、エンタープライズ・ブックマーキング、および情報アーキテクチャで使われる。ドメイン・オントロジの生成はエンタープライズアーキテクチャフレームワークの定義と利用への基本である。
「オントロジー」という用語jは、哲学が起源であり、多くの異なった方法に適用されている。単語『オントロジー』は、ギリシャ語の文字通り'存在'(on)を意味するὄνから来ている。コンピュータ科学内での中核となる主旨は、タイプ、特性、および関係タイプのセットから成る世界を記述するためのモデルである。正確にこれらの変化の周りに準備されるものは様々だが、それらはオントロジーの必需品である。実世界と一つのオントロジーでのモデルの特徴との間の近い類似性が一般に期待されている[3]。
多くのオントロジーがコンピュータ科学と哲学の両方で共通に持っているものは、エンティティ、アイデア、およびイベントに関する特性と関係とともに、それらをある分類システムに沿って表現することである。両方のフィールドで、一つは存在論的相対性(例えば、哲学におけるQuineとKripke、コンピュータ科学におけるSowaとGuarinoの問題で重要な作業を見つけ出し、そして規範的オントロジが実行可能かどうかに関わる討議をする(例えば、哲学における基本[4]を議論し、AIにおけるCycプロジェクトを議論することである。2つの間の相違は主として焦点の問題である。コンピュータ科学者が第一次原則の議論(そのようなものが固定化された本質として存在するかどうか、あるいはエンティティがプロセスよりオントロジー的により一次的でなければならないかどうかのような議論)にあまり関わらない一方で、哲学者はコンピュータ科学における研究者より固定化され統制された語彙を確立することにそれほど関心がない。
歴史的に、オントロジーは、何が存在するかの存在の本質である形而上学として知られる哲学の分岐として発生した。この基本的分岐は、特定と一般の間、内因と外因の間、および本質と実在の間の関係に注目して、存在の様々なタイプまたはモードの分析に関係する。特定におけるオントロジー的問合せの伝統的目標は、それらの基本的分類、あるいは種別を発見するため、自然に落着くオブジェクトへ『そのジョイント』の世界に分離することである[5]。
20世紀後半に、哲学者は、大変細密なオントロジー自体を実際に「構築する」こと無く、オントロジーを構築可能な手段あるいはアプローチを議論した。対照的に、コンピュータ科学者は、「どのように」それらが構築されるかについて少しの議論で、WordNetやCycのような大規模で堅牢なオントロジーを構築した。
1970年代中ごろから、人工知能分野の研究者達は、知識の獲得が大きくて強力な人工知能システムを構築する上で重要である、と認識した。人工知能研究者は、一定の自動化された理由づけのタイプを可能にするコンピュータ的モデル として彼らが新しいオントロジー(概念体系)を創作することを議論した。1980年代に、AIコミュニティは、モデル化された世界と知識システムの構成要素の理論の両方を参照するため、用語「概念体系(オントロジー)」を使い始めた。何人かの研究者は、哲学的オントロジーからひらめきを描いて、適用される哲学の一種としてコンピュータ的オントロジーを眺めた[6]。
1990年代初期に、Tom Gruberによる、幅広く引用されたWebページと論文『知識共有のため使われるオントロジーの設計に向けた原則』[7] が、コンピュータ科学における技術用語として「概念体系(オントロジー)」の意図的定義が認められた。Gruberは、概念化の仕様を意味する用語を紹介した。すなわち、概念体系は、あるエージェントまたはエージェントのコミュニティのため公式に存在し得る、概念と関係性の(プログラムの公式仕様のような)記述である。この定義は概念定義のセットとしてオントロジーの用途と整合しているが、しかしより一般的である。そしてそれは、それを哲学で使うより用語の異なった感覚である[8]。
Gruberによれば『オントロジーは時には、クラスの階層的分類体系(タキソノミ)、クラスの定義、及びその包括的関係と等価であるが、しかしオントロジーはそれらの形式を限定する必要はない』に従う。オントロジーはまた、用語を紹介するのみで世界についてどんな知識も付加することのない典型的な論理感覚での定義である、保守的定義に限定されない[9]。概念化を規定するため、一つは、定義された用語の可能な解釈を制約する公理を述べることが必要である[1]。
21世紀の初期に、認知科学の学際的プロジェクトが、共により近い2つの学者サークルに持ち込んだ[要出典]。例えば、コンピュータ科学の研究者が、オントロジー(時には彼らの手法のため直接的結果)で作業するそれらの哲学者を更に参照する一方で、コンピュータ科学の公式なオントロジー(時にはソフトウエアの作業中ディレクトリでさえ)を分析する哲学者を含む『哲学におけるコンピュータ化の転向』の議論が存在する。未だに、これら両方の分野の多くの学者が、認知科学のこの傾向に係わり、そしてお互い独立に作業を続け、それらの異なる懸念を別々に追求している。

オントロジの構成要素
現代のオントロジは、それがどのような言語で表現されるかに関係なく、多くの構造的類似性を共有する。上記で述べたように、ほとんどのオントロジーは個体(インスタンス)、クラス(概念)、属性、および関係を記述する。この節ではこれら構成要素のそれぞれが一通り議論される。
オントロジーの共通な構成要素は下記を含む:
エンティティ: インスタンス又はオブジェクト(基本または『基幹レベル』オブジェクト)
クラス: セット、 集合、 概念、 プログラミングにおけるクラス 、オブジェクト・タイプ、あるいはモノの種類
属性 : オブジェクト(及びクラス)が持ち得る、側面、特性、特徴、特長、あるいはパラメータ
関係: クラスとエンティティが他のそれと関係づけられる方法
機能条件:一つの表明における一つの個体の場所で使われる特定の関係から形成される複雑な構造
制約: 入力として受け入れられるいくつかの主張のため真でなければならない公式に表明された記述
ルール:ある特定の形式で主張から描き出される論理的推論を記述する先行的結果のif-then文の形による表明
公理:オントロジがアプリケーションのそのドメインを記述する全体的理論を一緒に構成する、論理形式における(ルールを含む)仮定。この定義は、生成文法や公式論理における『公理』の形式とは異なる。それらの専門分野で、公理は、「先験的」知識と仮定されたステートメントであるだけを含む。ここで使う『公理』は、自明のステートメントから派生した理論も含む。
イベント: 属性または関係の変化。
オントロジはオントロジ言語を使って共通にコード化される。

オントロジー工学
概念体系工学(またはオントロジー構築)は、概念体系の構築のための手法または手法論を研究する、知識工学の一つのサブ分野である。この分野では、概念体系の開発過程、概念体系のライフサイクル、およびそれらをサポートするツール・スーツと言語を研究する[12][13]。
オントロジー工学は、ソフトウエア・アプリケーション、および事業体と特定のドメインのための事業手続きに含まれる知識を明示的にする。オントロジ工学は、事業用語とソフトウエア・クラスの定義に関係する障壁のような、意味的障害によって引き起こされた相互運用性の問題を解決する方向を提供する。オントロジ工学は、特定のドメインのため概念体系を開発することに関係するタスクのセットである[14]。

オントロジ言語
オントロジ言語は、概念体系をコード化するため使われる、一つの形式言語である。私有や標準ベースの両方で、概念体系のための多くのそのような言語が存在する:
共通代数仕様言語は、IFIP作業グループ1.3『システム仕様の基礎』で開発され、そしてソフトウエア仕様の領域でのデファクト標準として機能する、汎用論理ベース仕様言語である。それは今、モジュール化と構造化メカニズムを提供するための概念体系仕様に適用されている。
共通論理は、お互いに正確に変換し合えるオントロジ言語ファミリのための仕様である、ISO標準24707である。
Cycプロジェクトは、幾つかの高次の拡張を持つfirst-order predicate calculusに基づく、CycLと呼ばれるそれ自身のオントロジ言語を持っている。
オントロジ基盤手法とアプリケーション開発 (DOGMA) は、より高いレベルの意味的安定性を提供するための事実志向モデリング・アプローチを採用した。
Gellish言語は、それ自身の拡張のためのルールを含み、そこでオントロジ言語と概念体系を統合する。
IDEF5 (Ontology Description Capture Method)は、有用で正確なドメイン概念体系を開発と維持をする一つのソフトウエア工学手法である。
知識交換フォーマット (KIF)は、S-expressionに基づく第一次ロジックのための一つの構文である。
ルール交換フォーマット (RIF) と F-Logicは概念体系とルールを結合する。
Webオントロジ言語 (OWL)は、初期のオントロジ推論レイヤ (OIL)、DARPAエージェント・マークアップ言語 (DAML)、及びDAML+OILを含むオントロジ言語プロジェクトと同じように、Resource Description Framework (RDF) とRDFスキーマからのフォローアップとして開発された、概念体系的ステートメントを作る一つの言語である。OWLは、WWWを超えて利用されることを意図しており、そしてその要素の全て(クラス、特性、及び個々)は、RDF、リソースとして定義され、そしてUniform Resource Identifier (URI)によって識別される。
セマンティック・アプリケーション設計言語 (SADL)[15] は、Eclipseプラグインを経て入力される英語ライクを使う、OWLの表現の豊かさのサブセットを獲得する。
オープン生物医学概念体系 (OBO)、生物学と生物医学概念体系に使われる言語。
Meta-Object Facility (MOF) と UML は、 Object Management Group (OMG) の標準である。
理論上、概念体系は『公式な、共有される概念化の明示的仕様』[1]です 。オントロジーは、あるドメインをモデル化するため使われる、すなわちそこに存在するオブジェクトや概念のタイプとそれらの特性や関係の、共有される語彙を提供する[2]。
オントロジーは、情報を組織化する構造的フレームワークであり、世界またはその一部についての知識表現の形として、人工知能、セマンティックWeb、システム工学、ソフトウエア工学、バイオメディカルインフォマティクス、ライブラリ科学、エンタープライズ・ブックマーキング、および情報アーキテクチャで使われる。ドメイン・オントロジの生成はエンタープライズアーキテクチャフレームワークの定義と利用への基本である。

オントロジーと現象学
オントロジー(ontology)とは、「ギリシャ語のon(ものごとが“ある”)ということの意味を問う存在論」を意味する。特に、人工知能や知識表現の分野では、この意味を転じて、「対象とする世界に存在するものごとの体系的な分類と、その関係を明示的・形式的に記述する」という意味で使われる30)。
別々のコミュニティーでつくられたオントロジーを共有し、相互運用性を高めることを目的として、2004年に、RDFを拡張したOWL(Web Ontology Language)が勧告された31)。
OWLは概念を体系的に記述するための言語である。確かに、OWLはコンピュータ同士の間でのデータ共有を容易にしたが、その一方で、人間同士が概念そのものを完全に共有するには至っていない。概念自体を共有するためには、客観認識が大勢の間で一致して成立しうることが前提となる。
残念なことに、人間の理性によって客観的な認識が成立可能と考えられていたのはアリストテレスの時代の話であり、現代哲学では、一部の数学的概念を除き、この前提は成り立たないと考えられている。特に、分子生物学のように五感で捉えきれないミクロな世界の現象の表現にメタファーを多用する分野では、概念を厳密に定義できないケースが多い。
OWLのような記述言語を用いることで、ひとりの人の世界観をオントロジーとして体系的に表象することは可能だが、他者がそれを理解することは非常に難しい。後述する現象学によれば、概念と現象を直接結びつける客観的な方法などは存在しない。代わりに、“現象学的還元”というプロセスによって、お互いの認識を漸近的に近づけていけるだけである。
現象学とは、人間の意識の中に認識が確立されていく過程を分析する学問であり、我々研究者がよく口にする「客観的」とか「主観的」という区別が、いかに不安定なものであるかを教えてくれる。
フッサール以前の近代哲学は、理性に対する信頼が揺らぎ始めていた時代であり、「意識と対象、対象となるモノ自体について、その客観認識がはたして可能か」ということが大問題となっていた。フッサールの現象学は、この難問に決着をつけた。というよりも、「認識問題の要諦は、“モノ自体についての議論”にはなく、“意識と対象の信憑構造”にある」と主張し、そこへ問題をシフトさせた。その方法が現象学的還元である。
例えば、今、目の前にリンゴが見えるとしよう。我々は、無意識のうちに、そこにリンゴが存在していると思いこんでしまうが、フッサールの方法では、その思い込みをいったん保留にし、なぜ、自分はそのような思い込みをするに至ったかを振り返ってみるのである。目に映る赤、光沢。手に取ったときの質感や匂いなどのクオリア。目を閉じたり開いたりしても、それら原体験が絶えず迫ってくることによって、自らの意識が、リンゴの存在をこれ以上疑うことを断念し、ついには客観的に存在していると認めるに至る。このような意識の信憑構造こそが、認識問題の要であるとフッサールは主張している。
人間同士のコミュニケーションで認識の違いが生じた場合、現象学的還元によって、それぞれの判断のもとになった原体験を一緒に振り返えることで、人間に生じやすい思い込みを修正することが可能になり、両者の認識の一致する方向へと志向していく。
特に、自然科学者にとって現象学的還元は非常に大切な行為である。彼らは、自らの判断の根拠について疑義が生じたときは、常に実験ノートにまでさかのぼり、思い込みのもととなった原体験を内省する。フッサールの現象学的還元はなぜそのような思い込みをしたのかを反省し、原体験であるクオリアにまでさかのぼる行為であるため、自然科学者にとっては比較的実践しやすい。
(一方、フッサールが提唱している“フォーマルオントロジー32)”は、形式的なレベルのみを記述対象に限定し、具体的要素である“マテリアルオントロジー”を徹底的に排除しようとするため、分子生物学になじみにくいという欠点がある。)
そこで、現象学的還元が容易なシステム設計が生命科学では重要になる。上述のセマンティックリンクの問題点は、リンクの意味をシンボリックに表象した段階で、実際の現象体験から切り離されて、ひとり歩きしてしまう点にあり、別の人がシンボルと実際の現象体験とを結びつけて理解しようとしても現象学的還元ができないという問題点があった。
生命科学では、人工知能的な推論よりも、まずは、機械可読な知識モデリングにまで辿りつくことが重要なマイルストーンとなる。そこで、我々は、機械可読性というセマンティックリンクの長所を残しつつも、そこに現象体験を含めておくことができる新しいセマンティックリンクが必要であると考えた。ここでは、簡単に“現象データ付意味リンク”と呼ぶ。
このリンクは、従来のように概念的な意味を表すと同時に、そのリンクの始点と終点にある具体的なリソースを包含する“現象”全体を、“インスタンス(外延)”として表す。このため、図4のように、リンク自体を1つの具体的な現象としてみなし、それらを他のリンクで結びつけることが可能である。
さらに、その現象体験を与える元になったデータをリンクに関連付けておくために、各リンクにフォルダをつけて、そこに人間にとっての現象的な情報(実験データやイメージデータや自然言語による文書など)を整理して置けるようにした(図4)。
このため、バイオロジストが最初につけたセマンティクスを、別の人(例えば、対象モデリングのエキスパート)と共に定義しなおす場合に、具体的なデータを眺めながら現象学的還元ができるようになっている。
このようにして、セマンティック・ウェブを共同で構築していくための情報基盤システムが後述のSWF(Semantic Web Folders)である。理化学研究所(理研)から公開されるデータを、SWF経由でも公開しようとしている。



荒井公康
http://www5f.biglobe.ne.jp/~kimmusic/
http://kimiyasu-arai.at.webry.info/

テーマ

関連テーマ 一覧


月別リンク

ブログ気持玉

クリックして気持ちを伝えよう!
ログインしてクリックすれば、自分のブログへのリンクが付きます。
→ログインへ
気持玉数 : 2
なるほど(納得、参考になった、ヘー)
驚いた

トラックバック(0件)

タイトル (本文) ブログ名/日時

トラックバック用URL help


自分のブログにトラックバック記事作成(会員用) help

タイトル
本 文

コメント(0件)

内 容 ニックネーム/日時

コメントする help

ニックネーム
URL(任意)
本 文
オントロジーについての抜粋 日記帳/BIGLOBEウェブリブログ
文字サイズ:       閉じる