page_banner

warta

Model Basa Gedhe (LLM) bisa nulis artikel persuasif adhedhasar tembung sing cepet, lulus ujian keahlian profesional, lan nulis informasi sing ramah lan empati. Nanging, saliyane risiko fiksi, fragility, lan fakta sing ora akurat ing LLM sing kondhang, masalah liyane sing ora ditanggulangi mboko sithik dadi fokus, kayata model AI sing ngemot "nilai-nilai manungsa" sing duweni potensi diskriminasi sajrone nggawe lan nggunakake, lan sanajan LLM ora nggawe konten maneh lan ngilangi asil output sing jelas mbebayani, "nilai-nilai LLM saka manungsa" bisa uga tetep nyimpang.

 

Conto sing ora kaetung nggambarake kepiye data sing digunakake kanggo nglatih model AI ngode nilai individu lan sosial, sing bisa dadi solid ing model kasebut. Conto kasebut kalebu sawetara aplikasi, kalebu interpretasi otomatis sinar-X dada, klasifikasi penyakit kulit, lan pengambilan keputusan algoritma babagan alokasi sumber daya medis. Kaya sing kasebut ing artikel anyar ing jurnal kita, data latihan bias bisa nambah lan mbukak nilai lan bias sing ana ing masyarakat. Kosok baline, riset uga nuduhake yen AI bisa digunakake kanggo nyuda bias. Contone, peneliti nggunakake model sinau jero kanggo film sinar X lutut lan nemokake faktor sing ora kejawab dening indikator keruwetan standar (dinilai dening ahli radiologi) ing sendi lutut, saéngga nyuda beda nyeri sing ora bisa dijelasake ing antarane pasien ireng lan putih.

Sanajan luwih akeh wong sing ngerteni bias ing model AI, utamane babagan data latihan, akeh titik entri nilai manungsa liyane sing ora diwenehi perhatian sing cukup ing proses pangembangan lan penyebaran model AI. AI medis bubar entuk asil sing nyengsemake, nanging umume ora nganggep kanthi jelas nilai-nilai manungsa lan interaksi karo penilaian risiko lan pertimbangan probabilistik, lan uga ora dimodelake.

 

Kanggo concretize konsep abstrak iki, mbayangno sing endocrinologist sing dibutuhake kanggo prescribe hormon wutah manungsa rekombinan kanggo cah lanang 8-taun-lawas sing ngisor persentil 3rd umur. Tingkat hormon pertumbuhan manungsa sing dirangsang bocah kasebut ing ngisor 2 ng / mL (nilai referensi,> 10 ng / mL, nilai referensi kanggo akeh negara ing njaba Amerika Serikat yaiku> 7 ng / mL), lan gen pengkodean hormon pertumbuhan manungsa wis ndeteksi mutasi inaktivasi sing langka. Kita pitados bilih aplikasi therapy hormon wutah manungsa ketok lan indisputable ing setelan Clinical iki.

Aplikasi saka therapy wutah hormon manungsa ing skenario ing ngisor iki bisa nimbulaké kontrovèrsi: dhuwur 14-taun-lawas boy wis mesthi wis ing persentil 10th saka ora pati cetho, lan puncak wutah hormon manungsa sawise stimulasi punika 8 ng/mL. Ora ana mutasi fungsional sing dikawruhi sing bisa mengaruhi dhuwur, utawa panyebab liyane sing dikenal kanggo dedeg piadeg, lan umur balunge 15 taun (yaiku ora ana wektu tundha perkembangan). Mung bagean saka kontrovèrsi amarga beda ing nilai ambang ditemtokake dening ahli adhedhasar Welasan pasinaon gegayutan tingkat wutah hormon manungsa digunakake kanggo diagnosa kurang wutah hormon terisolasi. Paling ora minangka akeh kontrovèrsi Asal-Usul saka imbangan entuk manfaat resiko nggunakake therapy hormon wutah manungsa saka perspektif patients, tuwane sabar, profesional kesehatan, perusahaan pharmaceutical, lan payers. Endocrinologists pediatrik bisa nimbang efek salabetipun langka saka injeksi hormon wutah saben dina kanggo 2 taun karo kemungkinan ora utawa mung minimal wutah ing ukuran awak diwasa dibandhingake saiki. Lanang bisa pracaya malah yen dhuwure mung bisa nambah dening 2 cm, iku worth nyuntikaken wutah hormon, nanging payer lan perusahaan pharmaceutical bisa terus views beda.

 

Kita njupuk eGFR adhedhasar creatinine minangka conto, yaiku indikator fungsi ginjel sing akeh digunakake kanggo diagnosa lan nemtokake penyakit ginjel kronis, nyetel transplantasi ginjel utawa kahanan sumbangan, lan nemtokake kritéria pengurangan lan kontraindikasi kanggo akeh obat resep. EGFR minangka rumus regresi prasaja sing digunakake kanggo ngira tingkat filtrasi glomerulus (mGFR) sing diukur, sing minangka standar referensi, nanging cara evaluasi kasebut relatif rumit. Persamaan regresi iki ora bisa dianggep minangka model AI, nanging nggambarake akeh prinsip babagan nilai manungsa lan penalaran probabilistik.

Titik entri pisanan kanggo nilai manungsa kanggo ngetik eGFR yaiku nalika milih data kanggo persamaan pas. Antrian asli sing digunakake kanggo ngrancang rumus eGFR biasane dumadi saka peserta ireng lan putih, lan aplikasi kanggo akeh etnis liyane ora cetha. Titik entri sabanjure kanggo nilai manungsa ing rumus iki kalebu: milih akurasi mGFR minangka tujuan utama kanggo ngevaluasi fungsi ginjel, apa tingkat akurasi sing bisa ditrima, carane ngukur akurasi, lan nggunakake eGFR minangka ambang kanggo micu pengambilan keputusan klinis (kayata nemtokake kahanan kanggo transplantasi ginjel utawa resep obat). Pungkasan, nalika milih konten model input, nilai manungsa uga bakal mlebu rumus iki.

Contone, sadurunge 2021, pedoman nyaranake nyetel tingkat kreatinin ing rumus eGFR adhedhasar umur pasien, jender, lan ras (mung diklasifikasikake minangka individu ireng utawa ora ireng). Penyesuaian adhedhasar balapan ditujokake kanggo nambah akurasi rumus mGFR, nanging ing taun 2020, rumah sakit utama wiwit takon babagan panggunaan eGFR adhedhasar balapan, kanthi alasan kayata tundha kelayakan pasien kanggo transplantasi lan balapan konkrit minangka konsep biologis. Riset nuduhake manawa ngrancang model eGFR ing babagan balapan bisa nduwe pengaruh sing jero lan beda-beda ing akurasi lan asil klinis; Mula, kanthi selektif fokus ing akurasi utawa fokus ing bagean saka asil nggambarake penilaian nilai lan bisa nutupi pengambilan keputusan sing transparan. Pungkasan, klompok kerja nasional ngusulake rumus anyar sing dipasang maneh tanpa mikirake balapan kanggo ngimbangi masalah kinerja lan keadilan. Conto iki nggambarake manawa rumus klinis sing prasaja nduweni akeh titik entri menyang nilai manungsa.

Dokter karo kasunyatan virtual ing kamar operasi ing rumah sakit. Ahli bedah nganalisa asil tes jantung pasien lan anatomi manungsa ing antarmuka virtual futuristik digital teknologi, holografik digital, inovatif ing konsep sains lan obat.

Dibandhingake karo rumus klinis kanthi mung sawetara indikator prediktif, LLM bisa uga kalebu milyaran nganti atusan milyar parameter (bobot model) utawa luwih, saengga angel dingerteni. Alesan kenapa kita ngomong "angel dimangerteni" amarga ing pirang-pirang LLM, cara sing tepat kanggo ngasilake tanggapan liwat pitakonan ora bisa dipetakan. Jumlah paramèter kanggo GPT-4 durung diumumake; Pendhudhuke GPT-3 duwe 175 milyar paramèter. Parameter luwih akeh ora ateges kapabilitas sing luwih kuat, amarga model cilik sing kalebu siklus komputasi luwih akeh (kayata seri model LLaMA [Large Language Model Meta AI]) utawa model sing disetel kanthi apik adhedhasar umpan balik manungsa bakal luwih apik tinimbang model sing luwih gedhe. Contone, miturut penilai manungsa, model InstrumentGPT (model karo 1,3 milyar paramèter) ngluwihi GPT-3 ing ngoptimalake asil output model.

Rincian latihan khusus GPT-4 durung diumumake, nanging rincian model generasi sadurunge kalebu GPT-3, InstrumentGPT, lan akeh LLM open-source liyane wis dibeberke. Saiki, akeh model AI sing nganggo kertu model; Data evaluasi lan keamanan GPT-4 wis diterbitake ing kertu sistem sing padha sing diwenehake dening perusahaan nggawe model OpenAI. Nggawe LLM kira-kira bisa dipérang dadi rong tahap: tahap pra-latihan awal lan tahap fine-tuning sing dituju kanggo ngoptimalake asil output model. Ing tahap pra-latihan, model kasebut diwenehake karo korpus gedhe kalebu teks Internet asli kanggo nglatih kanggo prédhiksi tembung sabanjure. Proses "rampung otomatis" sing katon prasaja iki ngasilake model dhasar sing kuat, nanging uga bisa nyebabake prilaku sing mbebayani. Nilai-nilai manungsa bakal mlebu ing tahap pra-latihan, kalebu milih data pra-latihan kanggo GPT-4 lan mutusake mbusak konten sing ora cocog kayata konten porno saka data pra-latihan. Senadyan upaya kasebut, model dhasar bisa uga ora migunani utawa ora bisa ngemot asil output sing mbebayani. Ing tahap fine-tuning sabanjure, akeh prilaku sing migunani lan ora mbebayani bakal muncul.

Ing tataran fine-tuning, prilaku model basa asring banget diowahi liwat diawasi fine-tuning lan learning penguatan adhedhasar umpan balik manungsa. Ing tataran fine-tuning sing diawasi, personel kontraktor sing nyewa bakal nulis conto respon kanggo tembung sing cepet lan langsung nglatih model kasebut. Ing tataran pamulangan reinforcement adhedhasar umpan balik manungsa, evaluator manungsa bakal ngurutake asil output model minangka conto isi input. Banjur ngetrapake asil perbandingan ing ndhuwur kanggo sinau "model reward" lan luwih ningkatake model kasebut liwat pembelajaran penguatan. Keterlibatan manungsa tingkat rendah sing nggumunake bisa nyetel model gedhe kasebut. Contone, model InstrumentGPT nggunakake tim kira-kira 40 personel kontraktor sing direkrut saka situs web crowdsourcing lan lulus tes saringan sing ngarahake milih klompok annotator sing sensitif marang preferensi kelompok populasi sing beda-beda.

Minangka loro conto nemen iki, yaiku rumus klinis prasaja [eGFR] lan LLM kuat [GPT-4], nduduhake, nggawe kaputusan manungsa lan nilai manungsa peran indispensable ing mbentuk asil output model. Apa model AI iki bisa njupuk macem-macem nilai pasien lan dokter? Kepiye carane nuntun umum aplikasi AI ing obat? Kaya sing kasebut ing ngisor iki, pemeriksaan maneh analisis keputusan medis bisa menehi solusi prinsip kanggo masalah kasebut.

 

Analisis keputusan medis ora kenal karo akeh dokter, nanging bisa mbedakake antarane pertimbangan probabilistik (kanggo asil sing ora mesthi sing ana hubungane karo pengambilan keputusan, kayata apa kanggo ngatur hormon pertumbuhan manungsa ing skenario klinis kontroversial sing ditampilake ing Gambar 1) lan faktor pertimbangan (kanggo nilai subyektif sing ana gandhengane karo asil kasebut, sing nilaine diwènèhaké minangka "kegunaan sistem lanang" sing diwilang minangka "kegunaan saka sistem 2", sing dianggep minangka "kegunaan sistem lanang" solusi kanggo pancasan medical Komplek. Ing analisis keputusan, dokter kudu nemtokake kabeh keputusan lan kemungkinan sing bisa digandhengake karo saben asil, lan banjur nggabungake sarana pasien (utawa pihak liyane) sing ana gandhengane karo saben asil kanggo milih pilihan sing paling cocok. Mulane, validitas analisis kaputusan gumantung apa setelan asil lengkap, uga apa pangukuran utilitas lan estimasi probabilitas akurat. Saenipun, pendekatan iki mbantu mesthekake yen pancasan adhedhasar bukti lan selaras karo preferensi pasien, saéngga nyuda jurang antarane data objektif lan nilai pribadi. Cara iki dikenalake ing lapangan medis sawetara dekade kepungkur lan ditrapake kanggo nggawe keputusan pasien individu lan penilaian kesehatan populasi, kayata menehi rekomendasi kanggo screening kanker kolorektal kanggo populasi umum.

 

Ing analisis keputusan medis, macem-macem cara wis dikembangake kanggo entuk manfaat. Umume cara tradisional langsung entuk nilai saka pasien individu. Cara paling gampang yaiku nggunakake skala rating, ing ngendi pasien netepake tingkat preferensi kanggo asil tartamtu ing skala digital (kayata skala linier saka 1 nganti 10), kanthi asil kesehatan sing paling ekstrem (kayata kesehatan lengkap lan pati) dumunung ing loro ujung. Metode pertukaran wektu minangka cara liya sing umum digunakake. Ing metode iki, pasien kudu nggawe keputusan babagan jumlah wektu sehat sing arep ditindakake kanggo ijol-ijolan kanggo periode kesehatan sing kurang. Cara gambling standar cara liyane umum digunakake kanggo sarana nentokake. Ing metode iki, pasien ditakoni endi saka rong pilihan sing luwih disenengi: urip sawetara taun ing kesehatan normal kanthi kemungkinan tartamtu (p) (t), lan nanggung risiko pati kanthi kemungkinan 1-p; Priksa manawa sampeyan bisa urip nganti pirang-pirang taun ing kahanan kesehatan. Takon pasien kaping pirang-pirang ing nilai-p sing beda nganti ora nuduhake pilihan apa wae, supaya sarana bisa diwilang adhedhasar respon pasien.
Saliyane metode sing digunakake kanggo nemtokake pilihan pasien individu, metode uga dikembangake kanggo entuk utilitas kanggo populasi pasien. Utamane diskusi kelompok fokus (nggawa pasien bebarengan kanggo ngrembug pengalaman tartamtu) bisa mbantu ngerteni perspektif. Kanggo nglumpukake utilitas klompok kanthi efektif, macem-macem teknik diskusi kelompok terstruktur wis diusulake.
Ing laku, introduksi langsung sarana ing diagnosis klinis lan proses perawatan banget wektu. Minangka solusi, kuesioner survey biasane disebarake menyang populasi sing dipilih kanthi acak kanggo entuk skor sarana ing tingkat populasi. Sawetara conto kalebu kuesioner EuroQol 5-dimensi, wangun singkat bobot utilitas 6-dimensi, Indeks Utilitas Kesehatan, lan Alat Kuesioner Inti 30 Kuesioner Kanker Eropa Khusus kanggo Riset lan Perawatan Kanker Eropa.


Wektu kirim: Jun-01-2024