百醜千拙草

何とかやっています

データ無辺誓解釈

2022-11-11 | Weblog
一月前に専門雑誌に投稿した論文、Negative dataなのでサクッとリジェクトされるだろうと思って待っているのになかなか返事が来ません。

この場合のNegative dataというのは、仮説から導き出される結論にそぐわないデータが出たということです。こうしたNegative dataは評価すること自体がしばしば困難ですし、評価できた場合、つまり「仮説が正しいと証明できなかった」のではなく、「仮説が誤りであると(ほぼ)証明できた場合」であってもその価値を示すのはしばしば容易でなく、出版は困難です。

このプロジェクトも三年ほどかけて、結構面倒な実験をやり通したものですが、Negative dataに終わりました。ただ、この結果に価値はあると思ったので、データを2つのfigureに絞って投稿しました。この実験をするには1年以上は最低かかるので、もしも次に同じような実験をやろうと誰かが考えた場合にこのデータは参考になるはずです。実験そのものの意義を評価してもらえたらチャンスはあるかもしれません。BioRxivには出していますが、今のところ特に反応はなし。ダメだったら報告書を書いて終わりです。

BioRxivの論文は、大量に発表される論文の中でその質を測る簡便な指標がありませんから、なかなか読んでもらえません。茫漠たる電子文書の宇宙の砂漠に投じられた砂粒のようなものです。しかし、正式に出版されたものでも、ほとんどの論文は、砂漠の一粒、大河の一滴にしかすぎません。私が興味を持っている分野だけでも毎週、300本ぐらいの論文が科学雑誌に出版されていますが、読む側にとってみれば、せいぜいそのうちの数本に目を通すぐらいが精一杯です。限られた時間内でどれを読むかを決めるときには掲載雑誌のレベルを見て私はトリアージしますが、BioRxivなどではそれができないので、BioRxivに出された論文の読者はその内容に最初から興味を持っている人の一部に限定されてしまうのだと思います。

Negative dataの出版は、以前から複数の人がその意義を喧伝し、実際、Journal of Negative Resultsなどいくつかの雑誌出版が試みられていますが、やはりNegative dataに関する研究者の抵抗は大きいものがあり、試みは成功とは言えません。15年ほど前、私の興味を持っていた分野で有名な分子があり、その生体での機能を知るためにノックアウトマウスのデータを皆が知りたがっていました。問題は機能的にオーバーラップする遺伝子が10以上存在するということで、あるグループは大変な苦労をしてそのうちの4つ以上をホモで欠くマウスの作成に成功したという噂を聞きましたが、それでも形質変化はマイルドで、そこから強い結論を得ることができなかったので、そのノックアウトのデータは現在に至るまで正式に発表されていません。

こうした場合、発表されていないからといって有意義なデータが存在しないということではありません。データそのものは有意義でも、データから強い結論が導き出されないと、科学論文としての価値が低いと評価されてしまうので、研究者の方も出版の労力に見合わないと考えて出版を諦めるということになりがちです。しかし、そうした意義あるデータが個人の実験ノートの中だけに埋もれて忘れ去られるぐらいなら、Preprintにしてとりあえず電脳空間に投入しておく方がマシではないかと私は思います。

すでに、この広大無辺のデータの宇宙には無数の解釈困難なデータが散らばっており、解釈を待っております。そうしたデータをマイニングし複合的、多角的に解釈して、人間が理解できる形に変換することを可能とするAIや情報伝達プラットフォームが開発できたら、科学研究は劇的に変化するでしょうね。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする