| 05 | 2026/06 | 07 |
| S | M | T | W | T | F | S |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | |
| 7 | 8 | 9 | 10 | 11 | 12 | 13 |
| 14 | 15 | 16 | 17 | 18 | 19 | 20 |
| 21 | 22 | 23 | 24 | 25 | 26 | 27 |
| 28 | 29 | 30 |
[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。
『キングクリムゾン』の能力の中では、この世の時間は消し飛び……
そして全ての人間は、この時間の中でブログが更新されてもその内容を覚えていないッ!
(元ネタが分からない人は今すぐこの教科書を買って読んでください。)
・・・・というわけで、2か月ほどブログの時間が消し飛びました。
決してブログの更新をさぼっていたわけではありません。あしからず。
先日まで、また屋久島に行っていました。
主にメタゲノム(メメタァゲノム)のためのサンプル収集(菌根、土壌、木材)をしていました。
終盤には休暇を取って、山登りをしていたりもしましたが。
涼しくなるとサンプリングがはかどってよいですね。
私はいつも真夏にサンプリングをやっていたので、この時期にサンプリングをするとこんなにも楽ちんなんだということに初めて気づきました。
まだこれから実験が大変なんですが、とりあえずサンプリングまでは順調に終わってよかったかなという感じです。
最近、以前に投稿していた新種記載の論文がアクセプトになって、もう少しでオンラインで見られるようになりました。
小ネタなのでさっくり載せるつもりで書いた論文でしたが、わけのわからないことを言う査読者に当たったせいで思ったよりも労力を割いてしまいました。
幸い、エディターは理解があったようで、リバイス原稿を送ってから数日で査読者に回すことなくアクセプトにしてくれたので、事無きを得ましたが。
時間のロスがありましたが、系統解析を再度勉強しなおす機会にはなったので、長い目で見れば悪くはなかったかもしれませんね。
ベイズ法でキノコの分布・分散パターンの推定した論文は先日、ようやく投稿しました。
投稿先はいろいろと迷った挙句、PNASにしました。
データの方はもう少し早い段階でそろっていたのですが、どういう話の展開に持っていくのがよいか迷ったため、少々遅れた感じです。
結局、体サイズの小さい生物(細菌・原生生物などの微生物)は汎世界的な分布に近い分布をもっているのではないかという有名な仮説があって、それに絡める感じの展開にしました。
菌類だけの話にすると、専門誌に出せって言われてしまいますからね。
この論文はサンプルのシークエンスを読んだあとで思いついたネタなのですが(褒められた行為ではないですね)、それにしては良い感じで話の展開を作れたかなという気はしています。
手法論的には間違いなく斬新ですから、うまく相性の良いエディター・査読者に当たってくれれば、それなりに評価はされるんじゃないかなと期待しています。
せいぜい、エディターリジェクトの憂き目にあわないことを祈っています・・・
ちなみに、以前の日記で迷っていたモデル選択についてですが、A・T氏の勧めもあってベイズファクターでやってみました。
これが最適な方法かどうかはわかりませんが、比較的容易にできる方法ですからね。
あと、'reversible jump MCMC'というのも見つけて、これが最も良いかと思ったのですが、結局、WinBUGSで謎のエラーにはまり続ける羽目になり、時間が惜しかったのであきらめました。
'reversible jump MCMC'というのは、パラメーター次元を任意に変えながらMCMCをしていく方法です(通常のMCMCでは、パラメーターの次元は固定されています)。
これぞ最尤法では実現できないベイズならではの方法って感じがします。
なので、この方法を使えば、モデル選択を切り離して行う必要がないかなと思ったのですが・・・
うまくいかなかった原因としては、'reversible jump MCMC'をやるには私の使っているモデルが複雑すぎたのかなという気がしています。
それに、まだこの方法を使ったいる人が少ないので、トラブルシューティングが充実していないというのも痛かったですね(私のやり方がまずかったのか、バグなのかもよくわからないですし)。
この方法についてはまた別の機会にでも使ってみようかなと思います。
ここ10日間ほど、京大の実習で屋久島に行っておりました。
今回は地元の方からの依頼もあって、屋久島の老齢林・二次林・スギ人工林の間で菌類(キノコ)の多様性の違いを評価するということで実習をやりました。
毎度のことながら、フィールド実習だけでまがいなりとも結果を出すというのに四苦八苦しましたが、何とか無事終わりました。
ちょっと前に覚えたEstimateSの多様性評価の解析がけっこう役に立ちました。
それにしても、今回は今までの実習の中でも疲労度が一番大きかったですね。
台風の影響もあって天候は毎日雨続きで、しかも調査地にはヒルがたくさんいて、調査環境としては最悪でした。
また、妙に小型のキノコがたくさん採れて形態種の同定作業がかなり難航しました(学生に同定をまかせたらかなり間違うだろうし、エンドレスになるんで、私がやりました)。
おまけに同時並行で多様性評価の解析方法とかも教えないといけなかったので、さすがに限界を感じました(実習直前まで別ごとに追われていて、レジュメ等を用意できていなかったのもいけなかったんですが)。
やっぱり、次回からは講師の数を増やしてもらった方がよいなと強く感じました。
今回は、参加してくれた学生らがみな意欲的で優秀だったのが唯一の救いでしたね。
必要最低限の指示で、自分で考え、動いてくれるのは本当にありがたい・・・
ちなみに、来週の月曜から、早速今回取ったサンプル(土壌サンプル)のDNA解析を行う実習が始まります。
まだ疲労が取れていないのでちょっとつらいですが、学生の方たちも熱心なので、何とか私もがんばろと思います。
ところで、最近は出している公募がことごとく落ちているので(といってもそんなに出していないですが)、軽くへこんでいます。
具体的にどこだとは言えませんが、とても魅力的な環境でぜひとも採ってもらいたいという公募もあれば、仮に選べるならばまずここは選ばないなというところの両方出しています。
前者の方はたとえ望み薄でも落ちた時は結構本気で落ち込みました。
後者の方は落ちた時は腹立たしいですが、行かなくて済んだというホッとした気持ちもあって、複雑な心境になりました。
前者と後者で敗因は別だと思っていますが、自分としての今反省すべき点は、業績が伸び悩んでいることかなと思います。
学振に通って以来、結構積極的に新しいテーマに取り組んでいっているので、今はその反動かなと理解してはいるんですが、論文が止まるとさすがにちょっと焦りだしますね。
今年度はなんとかたまりにたまっている論文を吐き出していければなと思っています。
↑
「おれたちポスドクは!論文を書くと思った時には!すでに行動は終わっているんだ!だから、論文を書くなんて言葉は使ったことがねぇ!成長しろ、Toadstool!でなければおれたちは栄光をつかめねぇ!」という突っ込みを受けそうなコメントをあえて書きました。
今日は454FLXにかける菌根サンプルのDNA実験をやっておりました。
昨日書いた論文の話も急がないとまずいのですが、こちらの方もランの予定がおおよそ決められているので、8月中にはサンプルをほぼ用意しておかないといけないという事情があったりします。
今回の実験では、やたらと硬くて砕けにくい菌根サンプルのDNA抽出をどうするかで迷っていたのですが、ディープフィリーザーで冷凍してからビーズで破砕するという手法をとってみることにしました。
そうしたら、これまで砕けなかったのが嘘のように、見事、菌根サンプルをほぼ完璧に砕くことが出来ました。
中々すばらしい方法だなと思い、「このToadstoolがこの方法の名づけ親(ゴッドファーザー)になってやるッ!そうだな…『冷凍後、粉々にくだける!』という意味で『ダイアーさん法』というのはどうかな」と思っていたりしたんですが・・・落とし穴がありました。
サンプルが破砕できたのはよかったんですが、チューブまで破壊されていました・・・
プラスティック部分も冷凍すると壊れやすくなるんですねぇ・・・
まさに「かかったな!アホが!」って感じでした。
今日は主にDNA実験をやっていたのでさほど時間がなかったですが、昨日の続きを多少やりました。
ベイズの方は元のランをそのまま続けておいたら、750万世代を超えた辺りでようやくすべてのパラメーターが1つの山に収束しはじめてきたみたいで、もうちょっとだけ解析を続けたら何とか許容範囲のESSが得られそうな感じになりました。
Dirichlet parameterをいじった方のランはいまいちうまくいっていませんでしたが、デフォルトのランでうまくいきそうなんでこっちはもうよいかなって感じです。
CONCATERPILLARの方はまだ試せていません(そして十分に理論を理解できていません^^;)。
まぁ時間が許せば使ってみたいと思います。
それにしても、AU testやSH testで領域間の不調和の検定をするのって本当に正しいのだろうかというのが相変わらず気になっています。
異なる領域ごとで特定のクレードが同様に支持されるかどうかという意味でこれらの検定を使うのならば理解できますが、領域間を結合して系統解析してよいかどうかの判定に使ったりしてよいのだろうかと。
AU testやSH testはILD testと違って、あくまで系統樹を比較するための検定のはずなので、データセット間の不調和を検定するのは違和感を覚えるんですよね。
そういう意味では、最節約ベースで気持ち悪いとは言え、ILD testの方に分があると言えるのかもしれません。
まぁ深く勉強した上で発言しているわけではなく、あくまで直感的な印象として語っているだけではありますが。
最近は前に返ってきた論文の直しをやっています。
国際学会をはさんでかつ解析からやりなおしているので、結構時間をくっています。
今回の論文は小ネタのつもりで労力をかけるつもりがなかったので、あまり時間を取られるのは苦痛ではありますが、系統解析の勉強をやり直す機会にもなったのでまぁ必ずしも悪くはなかったかもしれません。
といっても、最近やらなければならないことが山積みなので、これ以上この論文で足止めをくっていると本当にやばくなってくるんですけどね。
系統解析で今悩んでいるのは複数の領域間の不調和の検定とベイズの収束についてです。
前者については、色々と問題があるのを知りつつも手軽さからILD testを使っていたのですが、査読者からSH testでやれって突っ込まれました。
SH testでやること自体は簡単なんですが、SH testにしろその改良版のAU testにせよ、系統樹をあらかじめ指定しないといけないので、系統推定のあやまりが結果に悪影響を与えそうなのもちょっとなぁって感じですね。
気のせいかP値がかなり低めにでるような気がしますし(特にAU test)。
よく分かりませんが、たぶん、一部の分枝の不調和が全体の不調和として出されているとかそんなところなんでしょうか?(この問題はILD testにもありそうですが程度の問題か?)
結局、何がよいのだろうか・・・?
調べてみたら、少し前にCONCATERPILLARってのが作られていました。
深くは読んでいませんが、それなりによさげな感じがします。
ただ、これはまた使い方が難しそうなソフトウェアですねぇ・・・
まぁWinBUGSを覚えてみて、人間やれば少しは出来るってことが分かったので、ちゃんとやれば理解できるんでしょうね。
しかし、唯でさえさっさと終わらせないとまずいのにこれからまた勉強している暇があるんだろうか・・・?
あとはベイズの収束についてです。
Kakusan4でcodonpartitionのモデルでやっているのですが、収束が非常に悪くて困っています。
Tracerで収束具合を見ると、他はおおよそESSが200を超えているのに、m[1]とm[2]というパラメーターだけが30~40付近を漂っているという微妙な状態に。
どうも二つの山ができているみたいで、MCMCがそれぞれ別の山につかまっているっぽい。
700万世代ほどやってこれなのでたぶんこれ以上増やしても無駄かもしれません。
仕方ないので、Dirichlet parameterの値を増やしてみて再度トライしました。
さてどうなることやら・・・
ちなみに、codonsharedのモデルでやると100万世代くらいであっさり収束するというのが不思議ですね。
codonpartitionにすると、partitionごとの塩基数が少なくなりすぎるからだろうか?
それにしても解析をやり直すのも大変なんですが、偏見を交えた長文で返してきた査読者への返事を書くのがかなり欝です。
結局半分以上は従えないのですが、まぁそれはよいとしても、一々説明するのがかなり面倒くさい。
これが格式の高い雑誌であれば頑張りますが、Mycologiaくらいのマイナー雑誌ではモチベーションがあがらない。
投稿を取り下げて別のジャーナルに投稿することもちょっと考えています。
系統解析をやり直したこと自体は自分にとって勉強になったので無駄ではないですし。
エディンバラから帰国しました。
下にも軽く書きましたが、スコットランドは中々楽しかったです。
さりげない部分まで町並みが優雅な感じで、やっぱりアジアとは違うなと思いました。
あと、8月とは思えないくらい温度が低くて、日中でも半袖では過ごすのがつらいくらい寒かったです。
また、高緯度地域なので、夜の9時半ごろまで日が沈まないというのも中々新鮮でした。
同じ北半球の国とは思えないくらい違いました。
料理に関しては決しておいしくはなかったですが、思っていたよりは普通でした。
まぁ私自身が純粋なスコティッシュ料理を意図的に避けていたせいもあるでしょうが(大半は日本食か中華の店ばかり行っていました)。
気をつけないと脂ぎった肉類に砂糖がまぶしてあるゲテモノ料理がありますが、そこを避けていればまだ何とかなるかなと。
サンドイッチとかに関しては、日本のものが元々かなり不味い部類なので、むしろ向こうの方がむしろ上でした(パン屋のパンのことじゃなくて、コンビニレベルで売られているパンのこと)。
さて、国際菌学会についてですが、全体的に見れば微妙な発表が多かったように思います。
材料学会ではありがちかもしれませんが、とにかく、同じような手法や解析方法で材料(場所)を変えただけって研究が多すぎます。
例を挙げると、系統樹を描いただけとか、環境サンプルからメタゲノムしただけとか・・・
何がツボなのかは人によって価値観が違うのでそこには突っ込みませんが、何か独自性というか自分なりのこだわりというか、そういったものをもうちょっと出して欲しいなと思いました(あと、オチをつけてほしい)。
あとは、invited speakerが大御所のおじいさん先生が多かったのはちょっと残念でした(材料学会では大御所を大事にしすぎるきらいがあるんですが・・・)。
いくら過去に偉大な業績を残した先生でも第一線から退いていると退屈な発表をしがちなので、もうちょっと若手でバリバリやっている人に発表の場を与えて欲しかったですね。
次世代シークエンサー(もはや次世代ではないですけど)に関しては、もうかなり使われている印象でしたね。
ですが、誰でも彼でも使っている感じではなくて、お金を持っている研究室が大々的にやっている感じではありました。
菌類ではやはりメタゲノムが流行でしたね。
ただ、上にも書きましたが、同じような研究が多すぎて聞いていてちょっと辟易しました。
横軸にリード数、縦軸にOTU(近似的な種の単位)のグラフを書いて、あと円グラムで●目の菌類が○%というやつですね。
出てきたデータ自体に意味があるのは分かるんですが、あれだけのお金をかけて出てきたのがこれかぁという気がしないでもなかったです。
発表を聞いていて退屈だったので、カエルの腸内の菌類やバクテリアのメタゲノムをしたらメメタァゲノムになるのかなぁとかどうでもよいことを考えていました。
ただ、アメリカのBrunsさんのところで雨水を採取してそこにどんな種類の菌類の胞子がどれくらい含まれるかを見た研究とかは面白かったです(胞子の多い菌類が実生により菌根を作りやすいかを調べた)。
こういう最新の機械の使い方はまさに研究者の発想力や独創性の差がもろにでますね。
私自身の発表は思っていた以上に好評でした。
元々、菌類の分布に興味を持っている人が多いということと、菌類の学会では国際学会まで行っても解析法方が稚拙な傾向があるので、私がやっているベイズ法による解析がとても高度に見えたのかもしれません(たぶん生態学会に行ったら普通のレベルなんですけど)。
Invited speakerの研究も含め、同じような目的の研究もいくつか見かけましたが、どれも生データをそのまま出したような研究ばかりだったので、これならまず負けていないなと思いました。
これから引用してもらうためにもさっさと論文を出さないといけないなと思いました。