2017年5月14日日曜日

プレプリントは読みやすい形式でお願いします

 最近出版されたNature論文(リンク)に関して、出版過程をメモします。投稿前に形式やプレプリント公開の仕方などについて調べていたのですが、参考になるものがあまりなかったので。雑誌の公式ルールはバラバラに書かれていて相当わかりにくく、噂レベルでは「Natureは公式にはプレプリント公開OKと言ってるけど実際はハネられるよ」「そもそもwordしか受けつけないんでしょ」みたいな話もあり、やはりちゃんとした実例報告はあったほうが良いかなと。

 投稿形式なんてまあどうでもよいのですが、せっかく生物系でもbioRxivなどへプレプリントを上げることが流行り始めているのに、雑誌投稿と同じ形式のものを上げている人が多く、それが古い投稿形式であるword1段組み行間空きまくりfigureとlegendバラバラなやつでは読みにくくて残念すぎるので、ぜひ変わってほしいということはあります。

[言うまでもないことですが、近年生物系を含めてほとんどの雑誌が投稿時のプレプリントサーバーへの原稿アップロードを公式にOKとしています(例外が気になる方はこちらを)。NIHは申請書でプレプリントを参照して良いとしましたし、ザッカーバーグさんもbioRxivを支援するそうです。ラボ周辺で生物系の方々にプレプリントアップロードを推しまくったところ、発生系の学生さんが投稿論文をbioRxivに投稿してみてくれたそうで、マジ最高悪いところが見つからないといっていました(本当)。]

 物理の理論系では特に、雑誌は見ずにarXivしかチェックしないという人もたくさんいます。その理由として、arXivの方が早いからということの他に、そもそもarXivに上がっているバージョンの形式が雑誌掲載バージョンとほぼ同じで読みやすいから、ということもあるように思います。バイオ系でも、雑誌掲載バージョンのように読みやすいフォーマットでbioRxivなどに上げるのが慣習化すれば、掲載前に皆がプレプリントを読む確率が上がるのではないでしょうか。

 読みやすいフォーマットとは何か、議論の余地があるところかと思いますが、少なくとも図のキャプションは図の近くにほしいですし、図の位置そのものも該当テキストの近くがいいです。印刷して一行一行添削する人以外にとっては、スペースを2行開けて書かれるのも、ページ送るストレスの元でしかないです。

 そうはいっても投稿先雑誌がそのように指定しているのだから仕方ないだろう、投稿後にプレプリント用に形式を変えたものを用意するなんてめんどすぎて死ぬ、と思われるかもしれません。スペースを縮めて図を再配置するだけなら30分くらいでできそうなものですが、その手間も惜しいからプレプリントなんて公開したくない、という方にはもはや何も言えません。

 とりあえず、公開する気はなくはないぞ、という方に言えることがあるとすれば、雑誌の投稿形式指定が今でもその超読みにくいやつに本当に縛られているのか、チェックしたほうがいいということです。少なくともnature系とscienceはそこまでstrictなことをもはや言っていませんし、下に示すように、最低限のことを守っていればかなりなんでも良さそうです。(規定を読む限りではC誌系は結構うるさいようですが、守らず投稿すると本当に怒られるのかどうかはわかりません。)

 LaTeXで組版が自由にでき、Wordでだって余白や図の配置が自由にできる世界に住んでいるのに、大切な原稿をあのスーパー読みにくい形式で用意し、そのままプレプリントとしてネットに垂れ流さなければいけない理由は、実はほとんどないのではないでしょうか。読みやすい感じにテキストや図を配置してそのまま投稿し、bioRxivやarXivにも同じものを上げていきましょう。さすればレフェリーもプレプリントウォッチャーも皆幸せです。

2016年5月20日 投稿
 LaTeXの2段組み(PRL形式、REVTeX使用)で図もSupplementary textもSupplementary figuresもすべて一つにしたPDFで投稿。行番号は入れろと指定があるので入れました。図はIllustratorで作りepsに出力してLaTeXで読み込む、という普通の方法。字数は大雑把に数えてもLetterの制限まで余裕があるようにしました(LaTeXで書いた原稿のword数を正確に数えるのは結構大変です。みなさんこれどうしているのでしょうか)。
 同バージョンを(行番号は抜いて)arXivに投稿(それがこれ)。あとでメールで確認したところ、最初に投稿したバージョンはarXivに上げて良いけれどレフェリーレポートの内容を反映させた後のものは上げないで、とのことでした。
 カバーレターは公式には必須じゃないと書いてありますが、僕が知る範囲では雑誌によらずみんな何かしらは用意しています。この論文ではA4で2ページ。1ページ目は論文の内容説明、2ページ目は100-word summaryを科学者向けと一般向けで二種類、その後にレフェリー候補者リストと署名。大学のマークとかは入れず、プレーンなwordファイル(カバーレターには式とか入れちゃいけないとゴーストがささやく)。
 他にはSupplementary videosを5本。avi形式で用意していたものをmovに変換(指定)して添付。

同6月7日 原稿がレフェリーへ送られたと連絡
 この間3週間弱、何が起きていたのかはよくわかりません。Manuscript tracking systemにCheck Statusというのはありますが、APS系と違って情報量が少ないです。”Manuscript under consideration"まではおそらく皆行き(Editor rejectの場合はそこから1週間以内を目安にお祈りメール)、レフェリーに回すまで(おそらくこの間に専門家の意見を聞いてる)その後特に連絡はありません。

同8月10日 レポート返却 
 待つこと二か月、レビューアーは最初から5人。査読者を増やしていたら時間がかかったよとのこと。えー。
 レポートは、2人からメジャーなコメント(可否は特に言及なし)、3人はポジティブ(わりと絶賛)+マイナーコメント。論文出版そのものに否定的なコメントは1つもありませんでしたが、エディターのメール文面ではメジャーコメントの一つ(biological relevance)が特筆されていて、それに答えられないなら…という雰囲気が醸し出されていました。レフェリーが誰も反対していなくてもrejectされうるとは怖い世界ですが、そういうものなのでしょう。
 フォーマートに関する言及はなし。初稿のサプリ関係の名称や立ち位置はかなり好き勝手やっていましたが、結局最終投稿まで何も言われませんでした。

同12月1日 再投稿 
 レンチウィルスを使ったノックダウンの条件検討や、細い領域に細胞を閉じ込めてイメージングする実験を実現するのにかなり時間がかかりました。元の実験をしていた日本のラボからアメリカに移っていたので、ライブイメージングのセットアップ違いなどでも一か月くらいロス。原稿も理論の説明の仕方を中心に大幅改造。すべてくっつけたPDF(初稿と同様)にして返送。
 カバーレターはまた2ページ。足した実験の説明と、最初の投稿以降に出た他のグループの関連論文についてコメント。
 レフェリーコメントへの返事は14ページ。クソコメントもちらほらあって夜中に思い出してイライラしたりしましたが、基本的にはすべてに反論orフォロー。

2017年1月11日レポート返却 
 第一弾でメジャーコメントをしてくれたレビューアー2人がポジティブ+マイナーコメント、他2人からはOK、最後1人は文面なしたぶんOK。

同2月13日 再々投稿
 実験を二つ足しました。細胞が元気なくやや時間ロス。神経幹細胞は特に集団挙動が断然美しいのですが、すぐ機嫌を損ねるので面倒見ているほうはやきもきします。
 カバーレター1ページ、レフェリーへの返事1ページ。レフェリーの一人が提案していた実験は難しくてできなかったので、代わりのデータを載せて納得してもらう方針。

同3月20日 ほぼアクセプト
 残っていたレビューアー2人からOKのレポートタイトル変更の提案、アブスト書き換えの提案。フォーマートの合わせ方についての細かい注意事項リスト。

同3月22日 最終投稿
 タイトルはエディター提案のものに変更。アブストはエディターの書き換えがひどすぎたので直し。Main textとmain figuresは出版社側でフォーマットしてくれるので、LaTeXのソースコードとEPSのまま提出。Supplementary Textは独立したPDFにしてそのまま提出(フォーマットはPRL形式のまま)。鬼門はExtended Data Figuresでした。
 Extended Data Figures(以下EDF)は出版社の直しが入らないにも関わらずオンライン版ではMain textにくっついて公開される(後述)ので、フォントや線幅などをNature formatに合わせないといけません。EDFが10枚あったのでそれの直しにかなりの時間をとられました。はじめから知っていたらこの時間はゼロだったので失敗。
 Natureは(2017年5月現在)Supplementary Informationとしてtextとfigureをくっつけたものを出すのを許していません。サプリで文や数式を足したいならtext+equationsだけのPDFにするかMethodsセクションに入れるか。サプリの図を足したいならExtended Data Figuresしかないです。これらのうち、MethodsとExtended Data FiguresがMain text+Main figuresの後ろにくっついたものがオンライン版では生成されます(つまりSupplementary TextのPDF以外)。サプリはサプリとして完結している方が美しいし読みやすいと思うのですが、図が中心的な役割を担うNatureのような一般向け雑誌としては、figureだけでもフォーマットそろえて本文につけときたいということでしょうか。また、Methodsにsupplementary text的な内容を書いている論文が多いのですが、字が小さすぎてあまり読む気がしない(そもそもMethodsは実験条件などの細かい情報を提供するセクションで、一から理論を説明すべき場所ではないのでは?)ということで、われわれの場合は式などはすべてSupplementary Textとして別ファイルにしました。
 他にも指定されたいろいろな書類を提出。

同4月3日 アクセプト 

同4月7日 公開スケジュールの連絡
 12日にweb公開するからよろしく、といきなりメール。校正とかはないよ、とのこと。Accelerated Article Previewで出したいが良いか、という連絡には3/22にOKと返事をしていましたが、アクセプトから掲載までがあまり速いので驚きました。投稿・再投稿時に数か月スケールで待たされている間はすることがありませんが、アクセプト後はプレスリリースなどを準備したいのでむしろ待ってほしい感じです(結局ほぼ1日で急いで書く感じになりましたが、東大理のスタッフの方々の迅速な対応のおかげで会見などもできました)。

同4月12日 Web公開(Accelerated Article Preview)
 同じ号に掲載された論文で、別のグループが僕たちの研究に関連する現象を別の系で見つけたと報告していました。同じ号になるように計らってくれていたのですね。あちらの仕事の存在は噂には聞いていたのですが、投稿日が異様に近かったり、アクセプトまでの時間が大体いっしょだったのは偶然だと思われるので、スクープされなくてラッキーでした。
 とりあえずプレプリント公開からここまで、11か月弱かかっています。全327日のうち僕らがもっていたのは147日で、残りの180日は向こうが持っていました。ほむ。

同4月27日 First proof
 論文の紙面掲載は5月なので、校正はここからです。10箇所ほど直しがありました。

同5月3日 Second proof

同5月18日 (予定) 掲載