車輪を発明する

ファーマコメトリクス・モデリング研究所

2019-01-01から1年間の記事一覧

教科書

ちゃんと人に勧められる教科書がほしい。信頼できる教科書がほしい。 いや、自分で書けよ、とも思う。 こんな、適当なことが書いてある本ではなくて。思いつきのまま書き殴った内容、統一感がなく、粒度も不揃い、取り上げる内容も気まま、という本ではなく…

学会終了

QSP と ML に集中しました。 最終日の、PMxian は stat か pharmacologist かの議論、面白かったですね。あの場にいるほとんどの人たちの自戒を反映していたと理解しました。

目が覚めた

3 hr うとうとしただけで目が覚めました。今日は最終日です。まあ、この勢いで行ってしまいしょう。

機械学習のセッション

ちゃんと使えば、いや、下手くそに使っても、きれいに予測できて当然と言っていた。 課題はやはり、解釈である。 また、外挿可能性の問題もある。Mechanism-based モデルで外挿可能性を議論してきた 人たちにしてみれば、現状の機械学習による学習は我慢がな…

学会前日 (Pre Conference workshop)

目標 人に会うこと (あまり)寝ないこと 臆さないこと(いろんな意味で) QSP は、具体的な内容の発表がしにくいですよね。一般論とか考え方とかモデル評価のこととかに終始しました。機械学習を使ったポスター2件。同じことを考える人が同時に現れる、と…

海外発表

久しぶりですね。なんて内弁慶なのでしょう。

数学の知識の必要性

Pharmacometrics を実践するに当たって、数学そのものは必須ではない。プログラミングのスキルは必須ですけれども。 では、pharmacometrics に数学が必要ないかというと全くそうではない。 データがあって、それに、既存のモデルを当てはめて、結果を評価し…

データが差し替わった

以前にデータを入手したときの解析用データセット作成プログラムが見つからない。 というか、試行錯誤を続け、モデリングをしながらデータを作っていったから、元々一つのプログラムではなかったと思う。それを今回、一から全てやり直そうとしているのだけれ…

モデルの自由度とモデルの「意味」「解釈」

ファーマコメトリクスでは平気で非線形モデルを用いるからそもそもモデルの自由度が高い。 薬物動態のモデルの一番の基礎のところからして非線形なのだから抵抗がないのだ。それゆえに、「意味を考えられるモデル」「解釈可能なモデル」を作りたいと思う。 …

サポートベクター回帰

scikit-learn ライブラリを使ってみた。何でこんなにうまくいくのかなあ、と怖いです。 Cross validation をしてハイパーパラメータをチューニングした。 目には見えない高次元の世界で、やはりこれらの特徴量と、PMx パラメータとは相関しているということ…

解析の記録をつける

ノートを取る、ってことです。何をやったのかすぐ忘れる。本当にすぐ忘れる。1 ヶ月経つと確実に全く覚えていない。 どういうふうに覚えていないかというと どのファイルがどのモデルかがわからない(もちろん、プログラムを見て、その前後との差分を確認す…

PK/PD 解析の論文

確かにあれは、「当てはめてみました。うまくいきました」というだけであった。 それで何?、である。その先がない。 何がしたかったんだろうなあ。論文が書きたかった、以外の動機が理解できない。

機械学習

結果を数式で見たい。見てもどうにもならないのはわかるんだけど、見ないと安心できない。 「計算機」がコンピュータの中にしかないというのはどうも落ち着かない。

PK と PD

PK 解析が(population PK 解析が)こんなに広く用いられるようになったのにはやはり理由があると思う。それは、なんといっても、原理を「ひとつ」マスターすれば、どんな薬にも適用可能だということ。だから、全く異なる領域の薬に関する PK を研究している…

モデルで説明したいこと

開発の助けになる 意思決定の助けになる 薬物治療成績の向上に寄与する 患者の個別治療に役立つそういった目的は頭に置いた上で、そもそも、そのモデルで何が言いたいのかを考える。 モデルでなくても言えることなんじゃないだろうか、と自省してみる。もち…

POC

確かに私は、POC を確認することに(のみ)興味があるのだな。 POC といっても、計算やモデルのコンセプトに関するものです。飽き性、とか言わないで。

多重共線性

「多重共線性に気をつけるように」と散々脅されて、みんな、臆病になってるんじゃないかな。 あるいは、そう言われているのをいいことに、自分で考えることを放棄している。「そう注意されているから検討しませんでした」と。そうすれば、間違ったことをして…

母集団モデル解析手順の「ルール」

ルールがあるところと、「ルールがない」のがルールになっている部分とがある。ルールとしてあげる手順は、一般的には厳守すべきである。しかし、「ルールがない」ところにまで、「どこかで誰かが言っていた(どこで誰が、とは特定されないのが問題)」ルー…

それはエラーなのか

プログラムを書く、run (execute) する。エラーが出る。 さて、ここの対応が難しいんですよね。特に、「初心者」の場合。 エラーの原因はいくつかあります。 プログラムが間違っている データ構造が間違っている 初期値が適切でない そもそも、そのデータに…

最尤法の「収束」

最尤法では(対数)尤度が最大になる地点を探す。とはいうものの、実際の計算では最大になるところではなく、傾きがゼロになる地点を探している。傾きがゼロになると尤度が変化しない、その地点に達したら収束と判定しているのだ。 従って、変量効果分散が実…

Rejection sampling と MCMC

Rejection sampling ってこんなに効率悪かったかなあ。正規 + 正規の簡単なモデルなんだけどなあ。非線形だけれどもさ。これを、Metropolis-Hastings や HMC なんかの MCMC にしても、収束は遅いのかもしれない。チューニングしなさいってことです。それを半…

VPC はなんのためにあるのか

VPC 大流行ですね。でも、その真価をちゃんと理解して、みなさんは使っているのでしょうか。私自身はそこまで利用し切れていない、と断言します(恥)。 私はそもそも視覚認識が得意ではない。そのくせ、大昔は、多次元 NMR のチャートを眼で認識してピーク…

事後分布の推定

尤度関数は自分で定義するし、事前分布も自分で仮定する。 それぞれからのサンプルを乱数で得ることも可能(簡単)だ。一方で、事後分布は、尤度関数と事前分布の積に比例することまでは簡単にわかる。計算もできる。しかしその比例係数の計算が簡単ではない…

変量効果間の相関

確かに原理的には「すべての」変量効果(= 個体間変動)間には相関があるでしょう。完全に独立、なんてありえない。 しかし、それがデータから推定できるかどうかは別ですね。無理に相関を考慮すると、よく発生するのが「相関係数がほぼ 1 と推定された」と…

名言

R for Data Science: Import, Tidy, Transform, Visualize, and Model Data作者: Hadley Wickham,Garrett Grolemund出版社/メーカー: O'Reilly Media発売日: 2017/01/05メディア: ペーパーバックこの商品を含むブログを見るit's usually cheaper to buy more…

ブートストラップ

思い入れもあって、僕はこれが一番好きです。モデルの安定性がすぐわかる。安定性、というか、そのモデルを信頼していいものなのかどうか、その感触がわかる。「感触」だなんて職人みたいな言葉遣いではなく、サイエンスの言葉で語るべきなのだけれども、そ…

ロジスティックとかポアソンとか Time-to-event とか

パラメータ推定に関しては、どれも結局のところ、対数尤度を書いて、それを最大化する計算をするだけなので、個別のテクニックはいらない。もちろん、それぞれの分布を書ける必要はあります。一方で、モデルの評価となるとどれも難しい。ポアソンはまだまし…

論文の結果を再現する

論文に掲載されている図もしくは表を、論文に記載されている結果のみから再現することは可能か。 つまり、モデル式、パラメータに関する情報は必要十分に載っているかどうか。 もちろん、患者背景の細かな分布がわからない限り、結果を「完全に」(は無理に…

論文を読む。図を理解する

このモデルとこのパラメータからではこの図はありえないんじゃないかなあ。 時間軸が間違っているのか、パラメータが二桁ぐらい間違っているのか、いや 3 桁まるごと間違っているのか。 この図以外はすんなり理解できるのに。 この author(s) だから信用して…

パラメータ推定値の SE

パラメータ推定には誤差がある。推定誤差がある。その推定値はたまたま得られたあるデータ(のみ)に基づいて計算されたものだ。 その推定値は決して「真値」ではない。 よく言われることだが、仮にもう一度同じ試験をしてデータを取ったとしたならば、必ず…