今日こんなことが

山根一郎の極私的近況・雑感です。職場と実家以外はたいていソロ活です。

文章校閲能力の生成AI比較

2025年02月07日 | パソコン・メディア
生成AIを利用することは、情報生産性の面からもはや必須となりつつある。
情報生産は人間自身の力で、という倫理観もわからなくはないが、研究者がデータ分析をする際、現在では手計算(電卓)ではなく、エクセルやR、SPSSなどのツールを使うのが必須なのと同じだ
※:いいかげん人類は情報処理などの雑務から解放されて、霊的ステージアップにつながる”人格の陶冶”に邁進する段階に入りたい。

現在のところ、用途の多くは”情報検索”だろうが、中国のDeepSeekに関して取り沙汰されているように、情報の信頼性に難がある(そもそもネット上の情報は玉石混交)。
すなわち、情報検察については、情報の信頼度チェック機能のない現行の生成AIに全幅の信頼は置けない。
 
次に外国語記事の翻訳も役立つが、DeepLなどの既存の翻訳エンジンと比べると、まだ後者の方が一日の長がある感じだ(しかもプロンプト作成不要のコピペですむ)。
 
むしろ、文章作成の補助に使うなら問題ない。
一番重宝なのは要約で、しかも字数制限もできる。
上と合わせれば、外国の論文を翻訳+要約で読めて、先行研究の概観作業が効率的になる。
特に学術の世界では単語の一義化が前提なので(文化に内在する微妙なニュアンスや含意は不要)、専門用語ほど機械的な(1対1対応)翻訳で済む。
 
それと最近、文章の校閲ができることを知った。
すなわち自分の文章を第三者の目で修正できるのだ。
執筆者にとっては、自分の頭で論理構成された文を自分の目で校閲するには限度がある。
ワードにも若干その機能はあるが、頼るほどのレベルでないし、タイプミスは指摘されても、変換ミスは見逃される。
校閲は、文章の質を向上させるので、文章トレーニングが必要な学生にとって必須(なので卒論指導では指導教員が校閲を担当する)。

そこで、実際どの程度まともに校閲してくれるのか、複数の生成AIで試してみた。
まず校閲の素材となる文章は、今採点を済ませたばかりの学生のレポートにする。
こう言ってはなんだが、学生のレポートだと表現レベルはもちろん、論理構成レベルでも色々問題がある(それらが採点対象となる)。
 
ある学生の心理学関係の授業のレポート全文について、複数の生成AIにおいて「 以下の文章を校閲してください。」とコピペして、リターンを押した。
まず、OpenAIのChatGPT
「以下の点を校正しました。」と出て、表現の明確化、冗長な表現の削減、論理の流れの整理、用語の統一と自然な表現、という自前の(こちらが指定していない)基準から、問題となる文とその修正結果が示され、その後にそれらの修正後の全文が示される。
変換ミス(家庭→過程)も指摘され修正された。
完璧だ。
 
次にGoogleのGemini
「レポート校閲結果」と出て、最初にかなり圧縮した全文の要約が示される。
ついで、通し番号付きの大見出し・小見出しと、その内容が1〜2文で示される。
最後は「結論」という見出しで、結論が示される(原文でも結論は示されていた)。
そして大雑把な修正ポイントが示され、さらに「必要に応じて、参考文献や引用元を追加してください。図表などを活用すると、より分かりやすくなる可能性があります。」とアドバイスがつくが、これは一般的すぎてありがたみはない。
 
3つ目はMicrosoftのCopilot
「全体的に非常に良く書かれていますが、いくつかの表現を調整しました。ご確認ください。」と出て、修正後の全文だけが示される。
ただ「ですます調」に勝手に変更されている(それだけで読む気が失せる)。
ですます調の論文などあり得ないので、このままでは使えない(プロンプトで「である調」指定が必要)。
 
以上、3つを比較すると、優劣が明白で、校閲として使えるのはChatGPTだけ。
校閲箇所とその理由が示されるため、書き手にとって勉強になる。
Geminiの結果は校閲とはいえず、むしろレジュメ的要約に使える。
Copilotは校閲には使えず、検索用途に特化(出典を明示してくれる)。


最新の画像もっと見る

コメントを投稿

ブログ作成者から承認されるまでコメントは反映されません。