麻酔科学研究日次分析

概要

麻酔・周術期医療で注目すべき3研究が見いだされた。非心臓手術で遠隔虚血プレコンディショニング（RIPC）が死亡および脳卒中を減少させることを示す大規模メタアナリシス、国際ガイドラインを用いたAIの検索拡張生成（RAG）システムが術前適否評価で人間を上回る精度を示した研究、そしてスガマデクスがネオスチグミンに比べ早期の周術期神経認知障害を減少させることを示すメタアナリシスである。

研究テーマ

周術期臓器保護と転帰
術前評価におけるAI意思決定支援
神経筋遮断拮抗と神経認知転帰

選定論文

1. 非心臓手術における遠隔虚血プレコンディショニングと生存：無作為化試験のメタアナリシス

82Level Iメタアナリシス

British journal of anaesthesia · 2025PMID: 40185666

非心臓手術の72件のRCTにおいて、RIPCは対照群に比べ死亡（RR 0.74）を低下させ、術後脳卒中や入院期間も減少した。低コストで非侵襲的な周術期臓器保護戦略としてのRIPCの有用性を支持し、大規模多施設RCTの必要性を示す。

重要性: 非心臓手術でRIPCの生存利益を示した初の包括的メタアナリシスであり、副次的アウトカムも一貫した改善を示した。周術期の標準的介入としてRIPC導入の議論を促す。

臨床的意義: 高リスク非心臓手術において、臓器保護の補助手段として標準化されたRIPCプロトコルの導入を検討すべきである。確証的多施設試験の結果を待ちつつ実装可能な介入である。

主要な発見

非心臓手術における72件のRCT（n=7457）を統合。
RIPCで死亡が減少（88/2122 vs 102/1767；RR 0.74, 95%CI 0.57–0.98；P=0.03）。
ベイズ解析で死亡低減（RR<1）の確率が高いことが示唆。
副次的アウトカムとして術後脳卒中の減少と入院期間の短縮を示した。

方法論的強み

無作為化試験に限定した包括的メタアナリシスで、PROSPERO登録（CRD42024588358）あり。
頻度主義のランダム効果モデルとベイズ解析の双方を用いた頑健な解析。

限界

死亡データは72試験中28試験のみで報告されており、報告バイアスの可能性。
RIPCプロトコルや対象手術の不均質性があり、小規模試験効果の可能性も否定できない。

今後の研究への示唆: 標準化RIPCプロトコルを用い、患者中心アウトカムと費用対効果を含む実践的多施設大規模RCTが求められる。

背景：遠隔虚血プレコンディショニング（RIPC）は四肢の短時間虚血により遠位臓器を保護する介入であるが、生存への効果は不明であった。方法：成人の非心臓手術RCTを系統検索し、RIPCと対照を比較した。主要評価項目は最長追跡時の死亡。結果：72試験（7457例）を同定し、28試験で死亡を報告。RIPC群で死亡が有意に低下（RR 0.74, 95%CI 0.57–0.98, P=0.03）し、ベイズ解析でも利益確率が示唆された。

2. 10種類の大規模言語モデルに対する検索拡張生成と、手術適否評価への汎用性

81.5Level IIIコホート研究

NPJ digital medicine · 2025PMID: 40185842

58のガイドラインを用いた14の術前シナリオで、RAGを用いたGPT-4は96.4%の精度で人間を有意に上回り、幻覚もなく迅速な回答を示した。ガイドライン根拠のLLMは安全かつ効率的な術前適否評価を支援し得ることが示唆された。

重要性: 周術期の意思決定課題で、ガイドライン根拠のAIが人間を上回ることを示し、臨床導入の鍵である一貫性や幻覚リスクに対処した点が重要である。

臨床的意義: 医療機関は、データセキュリティ・監査証跡・臨床家の監督・地域ガイドライン統合のガバナンス体制下で、RAG型術前意思決定支援の試行導入によりリスク層別化と指示の標準化を図れる。

主要な発見

58のガイドラインに基づく14の術前シナリオで10種LLMのRAGを評価。
3234のAI回答と448の人間回答を比較し、GPT-4 RAGは96.4%の精度で人間（86.6%）を上回った（p=0.016）。
幻覚は認められず、出力はより一貫的で約20秒以内に提示された。

方法論的強み

複数LLMを対象に、ローカルおよび国際ガイドライン双方での直接比較ベンチマーク。
大規模回答データ（n=3234）を用い、人間との統計学的比較と幻覚の安全性評価を実施。

限界

症例シナリオによる評価であり実臨床での外的妥当性は実装研究を要する。
成績はガイドラインの質・網羅性やプロンプト設計に依存し、対象外ガイドラインへの汎用性は不確実。

今後の研究への示唆: AI-RAG支援の術前外来を対象とした前向き臨床試験により、手術中止率、安全事象、業務効率、費用対効果、ならびに公平性とガバナンスの評価が望まれる。

大規模言語モデル（LLM）は医療応用が期待されるが専門性に限界がある。検索拡張生成（RAG）は専門知識の統合により性能を高める。本研究は、35のローカルと23の国際ガイドラインを用い、術前適応判断と指示におけるLLM-RAGの正確性・一貫性・安全性を評価した。10種LLMで14シナリオに対し3234回答を生成し448の人間回答と比較。国際ガイドラインRAGのGPT-4は精度96.4%で人間を上回り（p=0.016）、幻覚を示さず一貫性も高かった。

3. 全身麻酔後の周術期神経認知機能に対する筋弛緩拮抗薬の影響：系統的レビューとメタアナリシス

72Level Iシステマティックレビュー/メタアナリシス

BMC anesthesiology · 2025PMID: 40186115

10件のRCT（n=1705）で、スガマデクスはネオスチグミンに比べ早期PNDを減少（RR 0.67）し、有害事象の増加はみられずTOF回復も速かった。術直後期の神経認知面での優位性が示唆される。

重要性: 臨床的に重要で頻度の高いPNDに関し、拮抗薬選択に影響し得る比較エビデンスを提示している。

臨床的意義: 高齢や認知脆弱性など早期PNDリスクが懸念される症例では、費用と供給状況を考慮しつつ、ネオスチグミンよりスガマデクスを選好する判断が支持される。

主要な発見

全身麻酔下の10RCT（1705例）を対象とした系統的レビュー／メタアナリシス。
スガマデクスはネオスチグミンに比べ、術後早期のPNDを減少（RR 0.67; 95%CI 0.48–0.94）。
有害事象の増加はなく、TOF≥0.9への回復が速かった。

方法論的強み

事前登録プロトコル（PROSPERO CRD42024520287）とGRADEによるエビデンス評価。
RCTのみに限定し、事前規定アウトカムで評価。

限界

PNDの定義や認知評価法に不均質性があり、追跡は概ね7日以内に限定。
出版バイアスの可能性と、同一レジメンの直接比較試験数が限られる。

今後の研究への示唆: 長期の神経認知転帰、費用対効果、フレイルや基礎認知障害などのサブグループ効果を検証するRCTが必要である。

背景：周術期神経認知機能障害（PND）は多因子の影響を受け、筋弛緩拮抗薬（NMBR）の関与が示唆されている。方法：主要データベースを創刊から2024年5月まで検索し、全身麻酔下手術でのNMBR比較RCTを対象とした。主要評価は術後7日以内のPND発生。結果：10RCT（1705例）で、スガマデクスはネオスチグミンに比べPNDを有意に減少（RR 0.67, 95%CI 0.48–0.94）。結論：スガマデクスは有害事象を増やさず早期PNDを改善した。