Jefのグループがかかわるすべての臨床プロジェクトには、3本の柱があります。最初の柱はサンプリングです。次の柱はサンプルを質量分析計を用いて分離・検出を行うことです。最後の柱は得られたデータを有効に活用するため、適切な処理を行うことです。かつてデータ処理はそれほど重要ではありませんでしたが、LECO社の技術進歩により大量のデータが得られるようになったため、より管理しやすいものにすることが非常に重要になりました。
「私たちが病院を訪ね、共同研究者に“モジュレーション時間は4秒に設定し、スペクトルは250 Hzで取得しました”と話しても、彼らは礼儀正しく“Yes, yes”とは言いますが、実は興味がありません。彼らにとって重要なのはそのサンプルが陽性だったか、陰性だったかだけです。」
患者に正しい治療を行うため、偽陰性および擬陽性を極力無くすことは非常に重要です。3本の柱はそれぞれ、このプロセスで重要な役割を果たします。
全ての結果はサンプルの入手から始まります。ぜんそく患者からサンプルを取得する方法はいくつかありますが、その多くは血液や痰の採取、気管支肺胞洗浄、気管支擦過、気管支壁の生検など、“侵襲的”処置と考えられています。対照的にTedlar® バッグに呼気を採取する方法は、迅速で患者に与える負担が少ない方法です。患者への説明も容易で、「ここにバッグがあるので息を吹き込んでください」と言えばよいのです。
サンプルを入手したらラボへ持ち帰り、LECO社Pegasus BT 4Dを用いて何10万もの化合物を分離、検出します。ここで多くの人が間違いを犯します、とJefは言います。
「あなたは適切なデータを使用できることを確認しなければなりません。GCxGC-TOFMSの欠点は、装置が非常に優秀なため、たとえモジュレーションの効率が悪くピーク形状が悪かったとしても、何らかの情報が得られることです。ただしそのような状態で最適な情報は得られません。良いピーク形状、十分なピーク強度、良い分離はどんな場合でも非常に重要です。」
一変量および多変量の特徴選択
一変量および多変量の特徴選択
Jefは様々な分離法を使用し、検出された1350の特徴を2つのセットに絞り込みました:27はフィッシャー比を用い、17はランダムフォレストを用い、そのうち7は重複しています。そこから彼は2つの異なるグループ、肺癌に陽性なグループと陰性なグループに分けることができました。
同じサンプルを高分解能Pegasus GC-HRT 4Dで分析することにより、バイオマーカーとして使用可能な化合物を掘り下げることができました。
上の図でわかるように、四角で囲んだピークはライブラリ検索スコアが871で1位にランクされたBenzeneacetaldehydeが正しい答のように見えました。しかしながら高分解能質量分析計による分析結果では質量誤差が271.15 ppmと非常に大きく、ライブラリ検索スコアが827で2位のBenzeneが質量誤差も-0.23 ppmと小さく、妥当であることがわかりました。2つの異なる装置を使うことで、Jefはより良い化学的情報を得ることができたのです。
この実験の後、Jefらは喘息患者の呼気分析を行いました。過去10年間で喘息患者は200%増加し、世界で3億3400万人以上、18歳以下の子供の14%に影響をおよぼしています。これは深刻な問題ですが、喘息患者の20%が間違った薬を処方されています。
喘息には主に2種の表現型、neutrophilic(好中球性)とeosinophilic(好酸球性)があります。 コルチコステロイドは好中球性喘息には効果がなく、抗生物質は好酸球性喘息には効果がありません。先に述べたように喘息診断の検体採取法の多くは侵襲的で、正確率も67から72%です。Jefのグループは呼気凝集物をGCxGC-TOFMSで分析する方法で、より実行可能な診断ができるかを検討するという課題に取り組みました。
その結果は録画したセミナーをご覧ください。
(英語、約40分)