2016年に刊行されたNature誌に,同誌が実施した研究の再現性に関するオンライン・アンケートの結果が掲載されている。それによると,回答した1,576人のうち70%以上が他の科学者の実験結果を再現しようとして失敗した経験があり,自身の実験の再現でも半数以上が失敗経験があったという。
学術論文に文章で記載された実験系は,テキストとして伝達される情報量の少なさが主因となり再現が難しいことが多いが,その解決を図る取り組みの中でJoVEのようなビデオジャーナルが登場し,動画論文によりプロトコルの共有が実現されるケースが増えてきた。
2017年2月にサービスを開始したCode Oceanは,論文に記載されたプログラム(コード)に着目した,コードの発見・共有・再利用のためのクラウドベースのプラットフォームだ。今日の研究成果には,コードや利用統計,アルゴリズムが含まれることが増えている。 自分の研究に有用なコードを従来の文献探索手法で発見したり,そのコードの再現のために,対応するハードウェア,OS,必要なソフトウェアをインストールし動作環境を構築し,さらに動作に問題があった場合のデバック対応などの一連の作業のために費やす時間と労力は研究活動の中で大きな負担となる。このような状況が,Code Ocean誕生の契機になっている。
Code Oceanは無料公開されていて,そこに収録されたコードやデータの閲覧とダウンロードは誰もが無料でできる。また,ログインすればCode OceanのプラットフォームのCPU(またはGPU)上でコードを実行することができる。読者側が動作環境を用意する必要がなくなる。
Code Oceanではコード・データ・その概要を記載したメタデータ・動作環境を一つのセットとしてCompute Capsule(コンピュート・カプセル)と呼称している。このコンピュート・カプセルをCode Oceanに登録するとDOIが付与され,発見性,アクセス性が向上するとともに引用も簡便になる。また,Code Ocean側での動作確認工程があり再現性が担保される。
現在,IEEE,Taylor & Francis,Cambridge University Press,SPIE,F1000Research,AACRなどの出版社がCode Oceanと提携していて,著者に論文投稿の際のコード・データのリポジトリとして推奨している。PDF論文では補助資料扱いだったコードとデータだが,HTML版ではウイジェットとしてコンピュート・カプセルを論文中に埋め込むことができる。読者はそのウイジェット内でコードを実行することができ,パラメーターやコードを変更し結果がどのように変わるか試すこともできる。その場合でもコンピュート・カプセルはオリジナルの状態で保持される。
Code Oceanはフリーミアムモデルを採用していて,ログインアカウントは無料で入手でき,月1時間までのプログラム実行と5GBのストレージを使うことができる。その範囲を超え利用する場合は,個人,グループ,法人別に課金プログラムが用意されている。
Code Oceanのようなコードの実行可能なリポジトリの動向を注視しつつ,このようなサービスが普及することで多くの研究者に認知・活用され,プログラムの再現や再利用にかかる手間が軽減されることで研究活動の効率化が図られることを期待したい。
<参考>
・Nature誌の記事
1,500 scientists lift the lid on reproducibility
https://doi.org/10.1038/533452a
・上記の記事のNatureダイジェスト版
「再現性の危機」はあるか?-調査結果-
https://doi.org/10.1038/ndigest.2016.160822
・Journal of Visualized Experiments (JoVE)
http://www.usaco.co.jp/itemview/template44_1_673.html
・Code Ocean
https://codeocean.com/