• サーチエンジンの概要
    検索システムをさし、代表的なものではYahoo, Lycos, google, Excite, Infoseek, AltaVista,などがあります。大きく分けて、ロボット型とディレクトリ型の2種類の登録方法があります。
    種類 型 特徴
    Yahoo ディレクトリ型 基本的にサーチエンジンの運営者によりURLがカテゴリ別に分類されて登録されている
    ISIZE
    Lycos ロボット型 定期的にインターネット上のWebページを巡回し、サーチエンジンデータベースサーバに蓄積する。
    Google
    Excite
    Infoseek
    goo
    AltaVista
    ランキングシステムによりキーワードがより頻繁に発見されるWebサイトのページほど高いスコアがカウントされ、検索者の要求に近いものであることを示します。

  • <META>タグ
    <META>タグはWebページの<HEAD>タグ内に記述され、サーチエンジンに対し付加情報を渡すことができます。ロボットエンジンはこのMETAにアクセスし、その情報を蓄積していきます。ここのキーワードが詳細で適切であるほど検索結果が上位にきます。
    <META> タグの使用例
    <meta name="keyword" content="1,2,3,.......">
    name属性のKeyword値を調べるためWebに関連するキーワードを定義する
    <meta name="description" contnt="説明">
    検索結果に最初の数行の変わりに簡易説明文を表示させる
    <meta name="build" content="値">
    作成日の定義
    <meta name="author" content="名前">
    製作者の定義

  • 検索インデックス
    サーチエンジンに登録されたWeb情報をインデックス化し、数百万のWebページを参照して成り立っています。タイプは以下の3通りです。

    静的インデックス/サイトマップ
    索引されたページのディレクトリがツリー状態で提示され、手動で検索可能です。Webページの多くはサイトマップで全体の構成などを示しており、ディレクトリごとに検索しやすくなっています。
    キーワードインデックス
    キーワードを入力すると、登録されているキーワードと比較し、合致したものを提供します。
    フルテキストインデックス
    サーバ内全ての文書が登録されていて、全情報を対象に検索します。企業や組織内で提供されることが多く、MicroSoft Index Server, Lextek International のOnixフルテキストインデックス、サーチエンジンもこれにあたりますが、あまりにも大きいデータ蓄積なので、インターネット全体を索引化するには向きません。

  • 上級検索技術
    より複雑なテーマを検索する効率を上げるために上級検索技術を使うと便利です。
    ブール演算子
    and, or, not, near などがあり、重要なキーワードを要求または除外することで効率よく絞り込みができます。

  • AltaVista, Excite, Lycos Pro の上級検索
    AltaVista
    基礎検索以外に上級用のインターフェイス(AltaVista Advanced)があり、Webスパイダーを使い、検索結果のリンクが全て有効なものを表示します。
    Excite
    基礎検索以外に
    クロス参照フィールドを含んだデータベースを持っています。キーワードとともに関連トピックも結果として返します。
    しかし、ブール演算子を使ったキーワードではクロス参照フィールドの参照が停止し、キーワードそのもののトピックを表示します。
    Lycos Pro
    登録の早さとデータベースの大きさが特徴。
    Webスパイダーを使い、リンクの有効性やWebページの存在性を保持しています。またキーワード合致タイプやヒット数をコントロールできます。
    演算子の用途 AltaVista Excite Lycos Pro
    演算子で結ばれたキーワード全てを含む AND, & AND AND, &
    演算子で結ばれたキーワードのいずれかを含む OR, | OR OR, |
    +で結ばれたキーワードを含む +
    上級インターフェイスでは不可
    + +
    特定の語は含まない AND NOT, !, -
    上級IFでは「−」は使えない
    AND NOT, - AND NOT, !, -
    ページ上に2つのキーワードが一定距離内にある NEAR, 〜   ADJ, NEAR, FAR, BEFORE
    複数語を1フレーズに結合 " " " " " "
    ブール演算子の句を1つのグループにする ( ) ( ) ( ),<>,[ ],{ }
    ワイルドカード *   $

  • 画像・人物情報の検索
    AltaVistaは画像リンクを提供。画像で検索結果を表示し、リンクを張っています。
    SurfMadisonPublicFileLibrariesでは画像の静的インデックスで、クリップアート、グラフィック、フォント等のダウンロードが可能。
    LycosのWhoWhereやYahoo人物検索は人物検索のために作られたWebサイトです。

  • メーリングリストやニュースグループ検索
    メーリングリスト - Infoseek(ml.infoseek.co.jp), Yahoo(www.egroup.co.jp)
    ニュースグループ - Google(groups.google.com)

  • その他のWeb検索ツール
    Aruchie
    anonymousFTPサーバの公開ファイルのための検索ツールです。FTPサーバのファイル名、属性をArchieサーバにデータベース化しています。Archieクライアント(またはTelnetクライアント)で希望のファイル名をArchieサーバに送るとArichieサーバがanonymousFTPを使い、要求ファイルを探し出します。
    ただし、Archieサーバアドレスとログイン名が必要で、検索コマンドを熟知する必要もありますが、現在、稼動しているArchieサーバを探し出すことは困難です。
    Gopher
    wwwが普及するまでもっとも広く利用されていたインターネット用の検索システムです。
    世界中のインターネットリソースをツリー構造のメニューから選択し、表示したり、FTPでダウンロードが可能。
    Veronica
    Gopherサーバの情報をインデックスで検索するシステム。
    Gopherサーバのアドレスなしでリンクを移動しながら検索することができます。