2008年10月13日

PDFファイルをネット上にアップしてみて…。

今日はワードやエクセルで作成したファイルをPDFファイルに変換し、そのファイルをウェブ上にアップロードした時の失敗談と反省みたいなものを記事にしてみましょう。^^;

Yahoo!やGoogleでウェブ検索をした時、下のように [PDF] という文字を目にすることがあります。これは言うまでもなく、PDF形式のファイルが検索結果にヒットしたことを意味します。

PDFファイルの検索結果(1)

この部分の名称をページタイトルと呼び、その下に抜粋されたテキストをスニペットと呼びます。検索した語句が太字で表示されますよね。では、次の検索結果のページタイトルをご覧下さい。

PDFファイルの検索結果(2)

なんか変じゃありませんか?そう、文字が重なり合ってしまってますよね。こんな見栄えの悪い失敗を皆さんにして欲しくないので、今回は私の経験から原因を試して納得したことをお伝えします。

PDFファイルの検索結果(3)

今回はGoogleをサンプルとして利用してますが、PDFファイルの場合は上のようにHTMLバージョンとしてHTMLに自動で変換したページをGoogleは保存しており、重なり合ってしまっているこのページを開いたのが下の状態です。

PDFファイルの検索結果(4)

おそらく、検索結果に表示されるページタイトルは、このHTMLバージョンのキャッシュから生成されているので、PDFファイルの段階で何か問題ありそうです。

ワードのフォント設定

ということは、既にワードで作成した時に原因がありそうなので、この部分のフォントの設定を見直すことにしました。最初に試したのがサイズ18を他のサイズと同じにしてみました。まぁ、これは可能性が低かったんですが変化なし。となると…。そう、原因はスタイルの太字だったんです。

PDFファイルの検索結果(5)

これを標準に戻してサーバにアップロードし、巡回ロボットのクローリング終了後チェックしたHTMLバージョンの状態が上というわけです。教訓として、ウェブサーバにアップロードするPDFファイルには、太字などを使用しないようにしましょうという大発見でした。^^;
posted by メガネ君 v0-0v at 18:59 | TrackBack(0) | Webサイト制作 | このブログの読者になる | 更新情報をチェックする

この記事へのトラックバック
×

この広告は1年以上新しい記事の投稿がないブログに表示されております。