ChatGPTで全記事を横断分析! 自社ブログの用語統一辞書を自動作成してみた

ChatGPT

ChatGPTで47記事を分析したら、ブログの意外な姿が見えてきました

「このサービス名、過去の記事ではどう表記していたっけ?」

「同じテーマの記事は何本あるんだろう?」

「ブログサイトではどんな用語がよく使われているんだろう?」

ブログ記事が増えてくると、こうした疑問を持つことがあります。

 

私たちが運営するブログサイト『TACT Creates』も、気が付けば50記事近くになりました。

そこで今回は、

「ChatGPTで自社ブログ全体を分析したら何が見えてくるのか?」

というテーマで実験してみました。

 

対象は『TACT Creates』に掲載されている47記事です。

単なる表記ゆれチェックではありません。

 

記事全体を横断的に分析し、

  • よく使われる用語
  • 製品名やサービス名
  • 記事間の表現の違い
  • 用語統一辞書

を自動でリスト化してみました。

ブログ記事が増えるほど「過去記事との整合性確認」が難しくなる

記事数が10本程度なら、過去記事を見返しながら執筆することもできます。

しかし、

  • 30記事
  • 50記事
  • 100記事

と増えてくると、すべてを把握し、整合性を確認することは難しくなります。

 

特に複数人で運営しているブログでは、

  • サービス名の表記
  • 専門用語の使い方
  • 同じ意味の別表現

が少しずつ増えていきます。

今回やったこと

今回の目標はシンプルです。

「『TACT Creates』全記事を分析し、用語統一辞書を作る」

これだけです。

 

まずWordPressから記事データをエクスポートしました。

 

WordPressには記事データを書き出す機能が標準で用意されています

WordPressの記事をエクスポートする方法

方法は非常に簡単です。

  1. WordPress管理画面にログイン
  2. 「ツール」→「エクスポート」を選択
  3. 「投稿」を選択
  4. 「エクスポートファイルをダウンロード」

これだけでXMLファイルが取得できます

記事本文、タイトル、URL、カテゴリーなどが含まれています。

ChatGPTに解析を依頼してみた

取得したXMLファイルをChatGPTにアップロードし、次のように依頼しました。

XML全件を解析して本格的な「用語統一辞書」を作ってください

これだけです。

 

Pythonも不要。

プログラムも不要。

特別なツールも不要。


本当にXMLファイルを渡して依頼しただけでした。

そして完成したものがこちら

数分後、ChatGPTからExcel形式の用語統一辞書が出力されました


47記事を解析して作成された用語統一辞書

しかも単なる一覧ではありません。

 

以下のようなシートに整理されていました。

  • 概要
  • 記事内の実際の表記ゆれ
  • 記事間の表記ゆれ
  • 実際の表記別集計
  • 製品名_サービス名_専門用語
  • 用語統一辞書
  • 記事一覧

 

かなり本格的な内容です。

しかも、単に用語を一覧化するだけではなく、記事間の違いやブログ全体の傾向まで分析されていました。

 

なお、以前にはChatGPTを使って表記ゆれを自動でチェックできるかを検証した記事も公開しています。

その記事では「決められた用語統一ルールをAIが守れるか」を検証しました。

今回はその発展編として、

「AIがブログ全体を分析し、用語統一辞書を作れるのか」

を試してみました。

 

分析で見えてきた用語の傾向

解析結果を見ると、それぞれのブログ内で使われている用語の傾向や表現の違いが見えてきました

 

例えば、

推奨表記 実際の表記・出現数
Photoshop Photoshop(23) / フォトショップ(2)
Web Web(2) / web(1)
InDesign InDesign(1) / インデザイン(8)
働き方改革 働き方改革(2) / 働きかた改革(7)

 

このように、同じ意味でも複数の表現が使われていることがわかります。

 

「記事内の実際の表記ゆれ」シート

 

もちろん、どちらも誤りというわけではありません。

 

しかし、

「このブログではどちらを採用するのか」

を決めておくことで、記事全体の統一感は大きく向上します。

人間では気付きにくい「記事間の違い」も発見

今回特に興味深かったのは、1つの記事内での単純な表記の違いだけではありませんでした。記事間で表現が揺れている語句も見つかりました。

 

例えば、

  • 出力
  • アウトプット

や、

  • ゲラ
  • 校正刷り

などです。

 

意味はほぼ同じですが、記事によって異なる表現が使われていました。

 

「記事間の表記ゆれ」シート

 

こうした違いは、1記事ずつ読んでいるだけではなかなか気付きません。

しかしAIは47記事を横断的に比較することで、

  • どのような表現が使われているのか
  • どの記事で使われているのか
  • どの表現が多いのか

を整理して可視化できます。

 

複数人で運営しているブログほど、このような分析の価値は大きいと感じました

ブログの特徴そのものも見えてきた

今回の分析では、ブログ内で登場する製品名やサービス名、専門用語も抽出できました

 

例えば、

  • ChatGPT
  • GPT-4o
  • GPTs
  • Gemini
  • 教えてAI 一発検索
  • 天秤AI byGMO

などです。

 

「製品名_サービス名_専門用語」シート

 

一覧を見ると、『TACT Creates』がAIやDTP関連のテーマを中心に発信していることが改めてわかります。

 

つまり今回の作業は、

「用語統一辞書を作る」

だけでなく、

「自社ブログのコンテンツ資産を棚卸しする」

作業にもなっていたのです。

人力では大変な作業をAIが肩代わり

今回の作業時間を振り返ると、

  • XMLエクスポート:約3分
  • ChatGPTへのアップロード:約3分
  • 辞書生成:約3分

程度でした。

 

昔なら、

「全記事を読み返して用語を拾う」

という作業だけで数日かかったかもしれません。

それが今では10分ほどで終わります

 

生成AIの得意分野は文章作成だと思われがちですが、

  • 分析
  • 分類
  • 整理
  • 可視化

も非常に得意です。

あなたの会社のブログでも試してみませんか?

今回対象にしたのは、『TACT Creates』に掲載されているブログ記事でした。

 

もし自社でブログを運営しているのであれば、ぜひ一度試してみることをおすすめします

長年運営しているブログほど、

  • 執筆者が変わっている
  • 記事を書いた時期が異なる
  • 使う用語のルールが曖昧になっている

といった理由から、記事間の表現の違いや用語のばらつきが見つかることがあります。

 

実際に私たちも「それなりに統一されているだろう」と思っていましたが、解析してみると複数の表現が混在している箇所が見つかりました。

こうした違いを一覧化できるだけでも、今後の記事制作や校正作業がかなり楽になります

 

さらに、この方法はブログ以外にも応用できます。

例えば、

  • 製品カタログ
  • 取扱説明書
  • FAQ
  • 社内規程
  • マニュアル
  • 提案書

などです。

 

むしろこうした文書を多く扱う企業ほど効果は大きいでしょう。

 

用語整理や表記統一だけでなく、

「どのような情報が蓄積されているのか」

を把握するためにも活用できそうです。

AIでブログを棚卸しする時代へ

今回、『TACT Creates』の47記事を対象に、ChatGPTでブログ全体を分析してみました。

その結果、

  • ブログ全体の傾向把握
  • 記事間の表現の違いの可視化
  • 製品名やサービス名の整理
  • 専門用語の抽出
  • 用語統一辞書の作成

を短時間で行うことができました。

 

生成AIは文章を書くためだけのツールではありません

 

大量の情報を整理し、分析し、可視化することも得意です。

 

私たち自身も今回の分析を通じて、
ブログの特徴や用語の使われ方を改めて把握することができました。

 

生成AIは文章を書くためだけでなく、
情報資産を整理・分析するパートナーとしても活用できそうです。

 

もし自社でブログやマニュアル、FAQなどを運用しているのであれば、
一度AIに「棚卸し」を依頼してみてはいかがでしょうか。

思わぬ発見があるかもしれません。