هوش مصنوعی و یادگیری ماشینی در پزشکی بالینی، ۲۰۲۳

در دهه‌های ۱۹۴۰ و ۱۹۵۰ که کامپیوتر و هوش مصنوعی (AI) تقریباً هم‌زمان توسعه می‌یافت، رشتهٔ پزشکی نیز به‌سرعت متوجه فواید و کاربردهای بالقوهٔ آن‌ها شد.۱، ۲ در سال ۱۹۵۹، کیو برادمَن (Keeve Brodman) و همکاران ادعا کردند که «انجام تفسیر تشخیصی صحیح از نشانه‌ها می‌تواند فرایندی باشد از همه جهت منطقی، و می‌توان آن را چنان کامل تعریف کرد که یک ماشین بتواند آن را انجام دهد».۳ یازده سال بعد، ویلیام بی. شوارتز (William B. Schwartz) در این مجله نوشت: «تأثیر عمدهٔ علوم کامپیوتر احتمالاً به این صورت خواهد بود که کارکردهای فکری پزشک را تقویت کرده، و در برخی موارد، عمدتاً جایگزین آن خواهد شد.»۴ او پیش‌بینی کرد که تا سال ۲۰۰۰، کامپیوتر در پزشکی نقشی جدید خواهد یافت، و به‌عنوان افزوده‌ای قوی بر توان فکری پزشک عمل خواهد کرد.

با این حال، در اواخر دههٔ ۱۹۷۰، نومیدانه مشاهده شد که دو رویکرد رایانش که در پزشکی به کار گرفته می‌شد—یکی سیستم‌های مبتنی بر قواعد، و دیگری سیستم‌های مبتنی بر انطباق یا بازشناسی الگو—در عمل آن‌گونه که امید می‌رفت، موفق نبوده است. سیستم‌های مبتنی بر قواعد بر پایهٔ این فرض ساخته شده بود که دانش خبره متشکل از تعداد زیادی قواعد مستقل و مختص موقعیت است، و کامپیوتر می‌تواند با استفادهٔ پیاپی از این قواعد در زنجیره‌های استنباط، تفکر خبره را شبیه‌سازی کند. راهبردهای انطباق به این صورت بود که تلاش می‌کرد بین مشخصات بالینی بیمار و بانکی از «پروفایل‌های ذخیره شده»، که امروزه به آن‌ها «اسکریپت بیماری» می‌گوییم،۵ برای یک بیماری خاص انطباق پیدا کند. در زمینهٔ درکِ خودِ فرایند تصمیم‌گیری بالینی تلاش‌های بیشتری صورت گرفت.۶ روشن شد که نقص کلیدی در اکثر برنامه‌های قبلی از فقدان آگاهی پاتوفیزیولوژی در آن‌ها سرچشمه می‌گرفت. با تلفیق کردن این‌گونه آگاهی‌ها، عملکرد تا حد زیادی بهبود یافت.

با این وجود، در دههٔ ۱۹۸۰، کامپیوترها قدرت انجام این کار را نداشتند. تا سال ۱۹۸۷، سیستم‌های مبتنی بر قواعد در برخی کاربردهای تجاری فوایدی را از خود نشان داده بود، ولی در پزشکی بالینی مؤثر واقع نشده بود. در حقیقت، شوارتز و همکاران نوشته‌اند: «این فرایند به‌قدری کُند است که حتی با کامپیوترهای پرسرعت امروزی، عملاً قابل استفاده نیست.»۷ آن‌ها در ادامه می‌نویسند: «چندین دهه است که می‌گویند کامپیوتر به‌زودی خواهد توانست در تشخیص‌های دشوار به ما کمک کند، و اکنون پزشکان ممکن است بپرسند که چرا این انقلاب به وقوع نپیوسته است.»۷

پیشرفت در علم داده‌ها

در دههٔ ۱۹۵۰، کامپیوترها خیلی بزرگ بودند و سرعت پایینی داشتند. نخستین گردونهٔ دیسک سخت دنیا، دیسک فایلِ مدل ۳۵۰ آی‌بی‌ام بود، که در سال ۱۹۵۶ ارائه شد. کل ظرفیت ذخیره‌سازی این دستگاه، ۵ میلیون کاراکتر (اندکی کمتر از ۵ مگابایت) بود. نخستین هارد درایوی که ظرفیت بالای ۱ گیگابایت داشت، آی‌بی‌ام ۳۳۸۰ بود، که در سال ۱۹۸۰ ارائه شد. این دستگاه به اندازهٔ یک یچخال بود، و ۵۵۰ پوند (۲۵۰ کیلوگرم) وزن داشت؛ قیمت آن ۱۰۰٬۰۰۰ دلار بود. ولی فناوری مدارهای مجتمع در حال پیشرفت بود. در سال ۱۹۶۵، گوردون مور از بنیان‌گذاران شرکت‌های فِیرچایلد سِمی‌کُنداکتور (Fairchild Semiconductor) و اینتِل (Intel)، پیش‌بینی کرد که تعداد ترانزیستورها در یک مدار مجتمع، و در نتیجه، قدرت رایانشی بالقوهٔ آن، هر ۲ سال دو برابر خواهد شد. پیش‌بینی او درست بود؛ این تغییر در تراکم نیمه‌رساناها را قانون مور می‌نامند. با این حال، قانون مور فقط مربوط به تعداد ترانزیستورها در سانتی‌متر مربع نیست، چرا که دیگر جنبه‌های پیشرفت فناوری، از قبیل سرعت پردازش و قیمت محصولات الکترونیکی، نیز پیوندی قوی با قانون مور دارد. با متراکم‌تر شدن مدارها، حافظهٔ کامپیوتر و سرعت رایانش افزایش یافت، به‌طوری که امروزه دستگاه‌های جیبیِ متداول، قوی‌تر از ابررایانه‌های دههٔ ۱۹۸۰ هستند که فضایی به اندازهٔ یک اتاق را اشغال می‌کردند، و قیمتشان کسری از قیمت آن ابررایانه‌ها است (شکل ۱).

شکل ۱: بهبودهای صورت گرفته در ۵۰ سال اخیر در توانایی کامپیوترها برای ذخیره‌سازی و پردازش داده‌ها.
پانل A پیشرفت ذخیره‌سازی داده‌ها را، هم از نظر اندازهٔ فیزیکی و هم از نظر هزینه به‌ازای واحد ذخیره‌سازی، نشان می‌دهد. نام RAMAC مخفف «روش دسترسی تصادفی حسابداری و کنترل» است. پانل B پیشرفت در سرعت را نشان می‌دهد. هر نقطه نمایانگر یک نوع خاص کامپیوتر و سال تقریبی ساخت آن است. این بهبودها در ذخیره‌سازی و سرعتْ امکان آن را فراهم کرده که یادگیری ماشینی از رؤیا به واقعیت بدل شود. داده‌ها در هر دو پانل برآوردهایی از چندین نوع معماری سیستم است و از منابع عمومی متعددی گرفته شده است.

پیشرفت در علم داده‌ها صرفاً به افزایش عملکرد، سرعت، و ظرفیت ذخیره‌سازی مربوط نمی‌شود. علاوه بر اطلاعات موجود در کتابخانه‌ها، داده‌های حاصل از سازمان‌ها، و سیستم‌های مستقر طراحی شده برای جمع‌آوری و کدگذاری داده‌ها، شکل‌های جدید فناوری می‌توانند از داده‌هایی که هم به‌وسیلهٔ انسان‌ها و هم به‌وسیلهٔ ماشین‌ها تولید شده‌اند، استفاده کنند. این داده‌ها غالباً آشوبناک و بی‌ساختارند. داده‌ها اکنون از منابع بسیار دیگری نیز حاصل می‌شوند، از جمله شبکه‌های اجتماعی، وبلاگ‌ها، اتاق‌های چَت، سایت‌های نقد محصولات، باهمستان‌ها، صفحات وب، ایمیل‌ها، سندها، تصاویر، ویدئوها، موسیقی، و نیز حسگرهای پوشیدنی و محیطی. خیلی از افراد هستند که برخی جنبه‌های سوابق پزشکی و داده‌های ژنتیکی شخصی خود را برای دسترسی آنلاین در اختیار عموم قرار می‌دهند. ظرفیت ذخیره‌سازی به‌قدری زیاد است که بخش‌های بزرگی از پیکرهٔ مضبوط دانش و فعالیت بشری به آسانی قابل ذخیره‌سازی و دسترسی است.

زمانی که داده‌ها به دست آمد، به چیزی بیشتر نیاز پیدا کردیم؛ نیازمند روش‌هایی برای شناسایی و پردازش داده‌ها بودیم. گوگل از آن رو در زمینهٔ جست‌وجوی آنلاین سرآمد شد که جست‌وجوهای انجام شده از سوی دیگران را به خدمت گرفت تا ببیند مردم در پی دانستن چه چیزهایی هستند. این نیازمند انقلاب دیگری بود، الگوریتم‌هایی ریاضی که می‌توانست با سرعت، و با حد قابل قبولی از اعتمادپذیری، این رفتار را ردیابی کند و کاربر نهایی را در یافتن اطلاعات خاص یاری نماید. ذخیره‌سازی متراکم‌تر داده‌ها و رایانش سریع‌تر امکان عملی حل عبارت‌های ریاضی در زمان حاضر را فراهم کرد که می‌شد از آن برای یافتن روابطی در میان داده‌ها استفاده کرد که تا پیش از آن ناشناختنی بود. در نتیجه، امکان شکوفایی و پیشرفت علم داده‌ها به‌گونه‌ای بی‌سابقه فراهم شد.

ما اکنون این توانایی را داریم که با استفاده از داده‌های بی‌ساختار، روابطی ناشناخته را در میان عناصر داده‌ها شناسایی کنیم، که این امکان استفاده از داده‌های پویا و داده‌های با سیاق‌های گوناگون را فراهم می‌کند، که وقتی با روش‌هایی غیر از روش‌های غیرمتعارف مورد تحلیل قرار گیرد، بینش‌های مفیدی را دربارهٔ رفتار انسان به بار می‌آورد. به‌تدریج که افزایش توان رایانش امکان آن را فراهم کرد که پرس‌وجوهای داده‌ای در زمان حاضر پاسخ داده شود، شبکه‌های عصبی نیز پیشرفته‌تر شد. ترانسفورمرها (یعنی مدل‌های یادگیری عمیق که به هر بخش از داده‌های ورودی، وزن‌های افتراقی می‌دهند) امکان پردازش زبان طبیعی را فراهم کردند. با این رویکرد، پیچیدگی‌های مدل‌های کامپیوتری مربوطه، و پیکرهٔ داده‌ها که مدل‌ها از آن گرفته می‌شد، روز به روز بزرگ‌تر و قوی‌تر می‌شد. هدفِ ساختن کامپیوتری که بتواند برخی از جنبه‌های تعامل انسانی را تقلید کند، از رؤیایی محال به واقعیت تبدیل شد.

به‌هم‌پیوستگیِ حاصل از علم داده‌ها نوع جدیدی از کشف را امکان‌پذیر ساخته است. افراد با استفاده از شبکه‌های اجتماعی پیوندهای خاصی را بین دوستان، اشیا، رویدادها، پسندها، ناپسندها، مکان‌ها، ایده‌ها، و احساسات برقرار می‌کنند. دولت‌ها از تحلیل شبکه‌های اجتماعی برای مقابله با حملات تروریستی استفاده می‌کنند. شرکت‌ها از طریق داده‌کاوی اطلاعاتِ اجتماعی و تعاملی، به‌دنبال یافتن پیوندهایی هستند که در کشف فرصت‌های جدید به آن‌ها کمک کند. دانشمندان در حال ساختن گریدهای عظیمی از داده‌های به‌هم‌پیوسته به‌منظور کسب یافته‌های جدید با استفاده از هوش مصنوعی و یادگیری ماشینی هستند. همان گونه که در زیر به تفصیل بیشتر بیان شده است، این پیشرفت‌ها منجر به ظهور کامپیوتر‌هایی شد که می‌توانند در انجام کارهایی که قبلاً پرزحمت بود، به ما کمک کنند. ربات C‑3PO در «جنگ ستارگان» نمونهٔ ساده‌ای از دستیارهای مجازی مبتنی بر هوش مصنوعی است (از قبیل سیریِ اپل، دستیار گوگل، و الکسای آمازون)، که جای خود را در زندگی روزمرهٔ ما باز کرده‌اند و در انجام برخی کارهای از پیش تعریف شده به ما یاری می‌رسانند. هر کس از این ابزارها استفاده کرده باشد، قطعاً متوجه راحتی آن‌ها شده است (مثلاً وقتی به آن می‌گویید که «تایمر اجاق را روی ۲۰ دقیقه تنظیم کن»)، ولی خیلی وقت‌ها هم موجب مزاحمت می‌شود، مثلاً زمانی که دستیار مطالب نامربوطی را در گفتگو مطرح می‌کند. هوش مصنوعی و یادگیری ماشینی نیروی محرکهٔ این دستگاه‌ها هستند.

هوش مصنوعی و یادگیری ماشینی در پزشکی

در دههٔ ۱۹۹۰ و اوایل دههٔ ۲۰۰۰، با آنکه هنوز سرعت کامپیوترها و حجم حافظهٔ آن‌ها به حد چندان بالایی نرسیده بود، مسئلهٔ انجام موفق برخی کارهای پزشکی که ماهیتی تکراری داشت و لذا انسان‌ها در آن مستعد خطا بودند، در شُرُفِ حل شدن بود. با صَرفِ مبالغ زیادی پول و تلاش‌های فکری فراوان، امروزه خواندن نوار قلب (ECG) و شمارش افتراقی گلبول‌های سفید، تحلیل عکس‌های ته چشم و ضایعات جلدی، و انجام دیگر کارهای پردازش تصویر به‌وسیلهٔ کامپیوتر به واقعیت پیوسته است. بسیاری از این کارهای مبتنی بر یادگیری ماشینی تا حد زیادی در روش کار روزمرهٔ پزشکی پذیرفته شده و به کار گرفته می‌شود. عملکرد این کارهای ماشینی بی‌عیب‌ونقص نیست، و خیلی وقت‌ها لازم است که فرد ماهری بر کار آن نظارت کند، ولی در بسیاری از موارد، با در نظر گرفتن تفسیر نسبتاً سریع تصاویر و فقدان تخصص در محل، به‌قدر کافی خوب است.

با این حال، استفاده از هوش مصنوعی و یادگیری ماشینی در پزشکی اکنون به چیزی بیش از خواندن تصویرهای پزشکی توسعه یافته است. برنامه‌های هوش مصنوعی و یادگیری ماشینی از زوایای مختلفی وارد رشتهٔ پزشکی شده‌اند، که از آن جمله می‌توان به موارد زیر اشاره کرد: کمک به شناسایی طغیان بیماری‌های عفونی که ممکن است از جهت بهداشت عمومی حائز اهمیت باشد؛ ترکیب یافته‌های بالینی، ژنتیکی، انواع خروجی‌های مختلف آزمایشگاهی برای شناسایی بیماری‌های نادر یا شایعی که به هر طریق ممکن است تشخیص داده نشده باشد؛ و کمک به عملیات اداری بیمارستان (شکل ۲). در طی ماه‌های آینده، این مجله مقالات مروری دیگری را منتشر خواهد کرد که به جنبه‌های خاص هوش مصنوعی در پزشکی در سال ۲۰۲۳ خواهد پرداخت. ولی قبل از آنکه نخستین مقاله حدود یک ماه دیگر منتشر شود، مهم است که به بررسی مسائلی بپردازیم که در کار با ماشین باید مَدّ نظر داشته باشیم.

شکل ۲: طیف کاربرد هوش مصنوعی (AI) در پزشکی
پانل A برخی از حوزه‌های بهداشت عمومی و پزشکی را نشان می‌دهد که هوش مصنوعی در آن ریشه دوانده و نقش آن رو به گسترش است. این ابزارها هم‌اکنون نیز به متخصصان پزشکی در کارشان یاری می‌رسانند. EMR مخفف پروندهٔ الکترونیک پزشکی است. پانل B حوزه‌هایی از رشتهٔ پزشکی را نشان می‌دهد که تأثیر هوش مصنوعی در آن به‌تازگی شروع شده، ولی هنوز کاملاً متداول نشده است.

مسائل حل‌نشده در رابطه با کاربرد هوش مصنوعی و یادگیری ماشینی در پزشکی

تعیین هنجارها

به‌طوری که در بالا گفته شد، استفاده از هوش مصنوعی و یادگیری ماشینی هم‌اکنون نیز در پزشکی برای تفسیر برخی از انواع تصاویر پزشکی، از قبیل نوار مغز، عکس ساده، CT‑اسکن، و MRI، تصاویر پوست، و عکس‌های شبکیه مورد استقبال قرار گرفته است. برای این کاربردها، مطالعات نشان داده است که هوش مصنوعی و یادگیری ماشینی از طریق مشخص کردن جاهایی از تصویر که از نرمال انحراف دارد، به ارائه کنندهٔ مراقبت بهداشتی یاری می‌رساند.

ولی از اینجا پرسشی کلیدی مطرح می‌شود، و آن اینکه نرمال چیست؟ این سؤال ساده یکی از ضعف‌های اصلی کاربرد هوش مصنوعی و یادگیری ماشینی را در پزشکی به‌صورتی که امروزه عموماً متداول است، آشکار می‌کند. سوگیری‌هایی که در «آموزش» دادن به الگوریتم‌های هوش مصنوعی و یادگیری ماشینی دخالت داشته، چه تأثیری بر کارکرد آن‌ها در دنیای واقعی دارد؟ ما چگونه ارزش‌های انسانی را در الگوریتم‌های هوش مصنوعی و یادگیری ماشینی وارد می‌کنیم، تا اینکه نتایج حاصل از آن‌ها منعکس کنندهٔ مسائل واقعی پیش روی پیشه‌وران بهداشتی باشد؟ مسئولان نظارتی چه مسائلی را باید در نظر داشته باشند تا مطمئن شوند که کاربردهای هوش مصنوعی و یادگیری ماشینی در موقعیت‌های مختلف به همان صورتی که ادعا شده، عمل می‌کنند؟ آیا برای مداخلاتی که بر پایهٔ هوش مصنوعی و یادگیری ماشینی صورت می‌گیرد، باید از همان رویکردهای کلاسیک استنباط آماری استفاده شود، و این استفاده به چه صورت باید باشد؟ این‌ها تنها برخی از مسائلی هستند که پیش روی ما قرار دارند؛ سری «هوش مصنوعی در پزشکی» به بررسی برخی از این مسائل خواهد پرداخت.

نقش هوش مصنوعی و یادگیری ماشینی در پزشکی بالینی

با وجود همهٔ مشکلات، نویدهای زیادی در این موضوع نهفته است. اگر الگوریتم‌های هوش مصنوعی و یادگیری ماشینی را بتوان به «اپلیکیشن»هایی تبدیل کرد که از نظر بالینی قابل استفاده باشد، آیا خواهند توانست در میان کوه داده‌های بالینی، ژنومی، متابولومی، و زیست‌محیطی راه خود را پیدا کنند و برای تشخیص دقیق مفید واقع شوند؟ آیا اپلیکیشن‌های مبتنی بر هوش مصنوعی و یادگیری ماشینی می‌توانند تبدیل به منشی شخصی شما شوند و وقتی را که صرف نوشتن پرونده و مستندات می‌کنید، آزاد کنند، تا بتوانید وقت بیشتری را با بیماران بگذرانید؟ آیا اپلیکیشن‌ها می‌توانند شما را به پرسیدن سؤالی کلیدی رهنمون شوند که بتواند در تشخیص افتراقی مفید واقع شود؟ آیا می‌توانند بر آن الگوریتم‌های هوش مصنوعی و یادگیری ماشینی غلبه کنند که شرکت‌های بیمه از آن‌ها استفاده می‌کنند، که سبب می‌شود که نتوانید درخواست PET‑اسکن یا CT‑اسکن کنید، یا غرامتِ وقتی را که صَرفِ بیمار یا خانوادهٔ بیمار کرده‌اید، دریافت کنید؟ در هر کدام از این عرصه‌ها، پیشرفت‌هایی به وقوع پیوسته است. ولی آیا به‌قدر کافی خوب هست؟

پژوهش بالینی دربارهٔ کاربردهای هوش مصنوعی و یادگیری ماشینی

ارزیابی پیشرفت، خود با مشکلات ویژه‌ای روبه‌رو است. در پژوهش‌های بالینی سُنّتی، وقتی که پیشرفت به‌صورت داروی جدیدی برای یک بیماریِ معین است، استانداردهای مشخصی برای آزمایش کردن و پذیرفتن داروی جدید به‌عنوان پیشرفت وجود دارند. اما زمانی که مداخله به‌صورت یک الگوریتم هوش مصنوعی و یادگیری ماشینی است نه به‌صورت یک دارو، با وجود آنکه جامعهٔ پزشکی انتظار همان سطح از اطمینان را دارد، ولی استانداردها برای توصیف و آزمایش مداخلات هوش مصنوعی و یادگیری ماشینی به‌هیچ‌وجه روشن نیست.

اگر قرار باشد یک اپلیکیشن به‌عنوان استانداردی برای شکل‌دهی، اصلاح، و بهبود روش‌های بالینی پذیرفته شود، در آن صورت استانداردهایی که باید در پژوهش‌های مداخله‌ای مبتنی بر هوش مصنوعی و یادگیری ماشینی رعایت شود، کدام است؟ این پژوهش‌ها سه مؤلفه دارد. نخست اینکه ساختار پژوهش باید به‌گونه‌ای که باشد که به یک پرسش معنی‌دار بالینی پاسخ دهد، به نحوی که بتواند بر رفتار کارشناسان بهداشتی تأثیرگذار باشد، و منجر به بهبود نتیجه برای بیمار شود. دوم اینکه مداخله باید قابل تعریف، قابل مقیاس، و قابل اعمال برای مسئلهٔ مورد نظر باشد. نباید تحت تأثیر عواملی خارج از حوزهٔ مسئله قرار گیرد و باید پیامدهایی داشته باشد که در محدودهٔ وسیعی از جمعیت‌ها و نرخ‌های شیوع بیماری، برای مسائل بالینی مشابه قابل اعمال باشد. آیا مراقبت مبتنی بر هوش مصنوعی و یادگیری ماشینی می‌تواند این استانداردها را تأمین کند—استانداردهایی که از یک مداخلهٔ درمانی یا روش تشخیصی آزمایشگاهی جدید توقع داریم—یا اینکه باید مجموعهٔ منحصر به فردی از استانداردها برای این نوع مداخله داشته باشیم؟ سوم اینکه وقتی نتایج پژوهش به‌گونه‌ای تأثیرگذار بر عملکرد بالینی مورد استفاده قرار می‌گیرد، پیامد آن باید برای تمام بیماران تحت بررسی سودمند باشد، نه فقط برای کسانی که از نظر مشخصات و یافته‌ها شبیه افرادی هستند که الگوریتم روی آن‌ها آموزش داده شده است. پس این سؤال مطرح می‌شود که آیا این‌گونه الگوریتم‌ها باید در انجام توصیه‌های تشخیصی و درمانی، ملاحظات بهداشت عمومی (مثلاً کمیاب بودن منابع مورد استفاده) را نیز در نظر بگیرند یا خیر، و اینکه این‌گونه محدودیت‌ها تا چه حد در فرایند تصمیم‌گیری الگوریتم دخالت داده می‌شوند.۸

استفاده از اپلیکیشن‌های هوش مصنوعی و یادگیری ماشینی در انجام پژوهش بالینی

هوش مصنوعی و یادگیری ماشینی این قابلیت را دارد که هم از طریق افزایش کارایی ثبت‌نام و تطبیق شرکت کنندگان مطالعه و هم از طریق تحلیل جامع‌تر داده‌ها، کارآزمایی‌های بالینی را بهبود داده و چه بسا آن‌ها را ساده‌تر و سریع‌تر کند. علاوه بر این، شاید امکان ایجاد گروه‌های شاهد مصنوعی از طریق انطباق دادن داده‌های تاریخی با معیارهای ثبت‌نام کارآزمایی هدف وجود داشته باشد. از هوش مصنوعی و یادگیری ماشینی برای پیش‌بینی و درک بهتر عوارض ناخواسته و زیرجمعیت‌های بیماران نیز می‌توان استفاده کرد. به نظر می‌رسد امکان آن وجود داشته باشد که هوش مصنوعی «بیماران مصنوعی» ایجاد کند تا بتوان پیامدهای تشخیصی یا درمانی را شبیه‌سازی کرد. ولی کاربرد اپلیکیشن‌ها و مداخلات هوش مصنوعی و یادگیری ماشینی موجب ورود برخی موارد عدم اطمینان می‌شود که باید هم در پروتکل‌ها و هم در گزارش‌دهی کارآزمایی‌های بالینی مورد توجه قرار گیرد.۹، ۱۰

در این سری مقالات دربارهٔ هوش مصنوعی در پزشکی، قصد داریم به بررسی پیشرفت‌ها، موانع، چشم‌اندازها، و مطالب جدید در حد واسط هوش مصنوعی و پزشکی بپردازیم. باید در نظر داشت که این رشته با سرعت در حرکت است، بنابراین، مطالبی که بیان می‌کنیم، مانند عکسی است که از درون قطاری سریع‌السیر از منظرهٔ بیرون گرفته شده باشد. به‌طور خاص، اتفاقاتی که در حوالی زمان انتشار می‌افتد، ممکن است به‌صورت مبهمی بیان شود، چرا که به‌سرعت تغییر می‌کند، ولی زمینهٔ دوردست این چشم‌اندازْ وضوح معقول و قابل قبولی خواهد داشت. یکی از عرصه‌هایی که در هوش مصنوعی و یادگیری ماشینی پیشرفت قابل‌توجهی دارد (یعنی روزمینهٔ تصویر در همان عکسی که گفتیم)، ظهور چَت‌بات‌های پیشرفته است که برای استفاده در دسترس عموم قرار گرفته است. گرچه چت‌بات‌های ارائه شده تازه در این اواخر به حدی از پیشرفتگی رسیده‌اند که بتوانند تأثیری بر عملکرد روزمرهٔ پزشکی داشته باشند، ولی ما بر این باوریم که قابلیت آن‌ها برای تأثیرگذاری بر نحوهٔ کار در رشتهٔ پزشکی قابل‌توجه است، و درست نیست که از بررسی قابلیت آن‌ها و نیز مشکلات بالقوهٔ ناشی از کاربرد آن‌ها غافل شویم.

چت‌بات‌ها در پزشکی

در این شماره از مجله، مقاله‌ای به قلم لی (Lee) و همکاران۱۱ به معرفی چت‌بات GPT-4 و کاربردهای پزشکی آن پرداخته است. این مقاله از سوی تیمی از پژوهشگران که برای نهادهای سازندهٔ GPT-4 کار می‌کنند، به رشتهٔ تحریر درآمده است. این چت‌بات آموزش گسترده‌ای داده شده است که شامل دانش پزشکی نیز هست. قبل از آنکه به بررسی آینده بپردازیم، نگاه سریعی به گذشته خالی از فایده نیست. چت‌بات یک برنامهٔ کامپیوتری است که با استفاده از هوش مصنوعی و پردازش زبان طبیعی، پرسش‌ها را می‌فهمد و به‌طور خودکار، مانند یک مکالمهٔ انسانی، به آن‌ها پاسخ می‌دهد. خیلی قبل‌تر، یک چت‌بات پزشکی به نام الایزا (ELIZA) بین سال‌های ۱۹۶۴ و ۱۹۶۶ توسط جوزِف وایزِنباوم (Joseph Weizenbaum) در آزمایشگاه هوش مصنوعی مؤسسهٔ فناوری ماساچوسِت توسعه داده شد (شکل ۳).

شکل ۳: چت‌بات‌ها در پزشکی.
پانل A اسکرین‌شاتی از خروجی یک چت‌بات خیلی قدیمی پزشکی به نام الایزا را نشان می‌دهد، که بین سال‌های ۱۹۶۴ و ۱۹۶۶ توسط جوزف وایزنباوم در آزمایشگاه هوش مصنوعی مؤسسهٔ فناوری ماساچوست توسعه داده شد. پانل B (برگرفته از لی و همکاران۱۱) [ترجمهٔ] ورودی و خروجی GPT‑4 را نشان می‌دهد، چت‌باتی که قرار است در سال ۲۰۲۳ در اختیار همگان قرار گیرد. BMI مخفف شاخص تودهٔ بدنی است.

فناوری چت‌بات امروزه تقریباً در همه‌جا یافت می‌شود، ازخدمات مشتریان گرفته تا دستیارهای مجازی شخصی که در بالا به آن اشاره شد. با کامپیوترهای قدرتمندی که امروزه در دسترس هستند، مدل‌های زبان میلیاردها پارامتر دارند، که می‌توان از آن‌ها برای تولید متن جدید استفاده کرد. این توانایی، در ترکیب با میزان تقریباً نامحدود داده‌های موجود (اینترنت) برای آموزش دادن شبکه، نشان می‌دهد که مدل‌های زبانی خواهند توانست کارهای بیشتر و بیشتری انجام دهند، که نمونهٔ آن سیستم چت تبدیلگر مولّد از پیش آموزش داده شده، یا ChatGPT، است.

ChatGPT یک مدل زبانی است که توسط شرکت OpenAI آموزش داده شده است. این سیستم در نوامبر ۲۰۲۲ عرضهٔ عمومی شد (https://openai.com/blog/chatgpt)، و روش جدیدی را برای تعامل افراد با ماشین‌های مبتنی بر هوش مصنوعی متداول کرد. چت‌بات‌های نسل جدید می‌توانند نقش منشی و مربی را داشته باشند، ولی برخی ایرادات کلیدی نیز دارند. بسیاری از ایرادات را توسعه دهندگان ChatGPT در زمان راه‌اندازی آن بیان کرده‌اند، ولی برای استفاده در پزشکی باید به‌طور خاص به آن‌ها توجه شود، که تفصیل آن در مقالهٔ لی و همکاران۱۱ آمده است. نسل کنونی چت‌بات‌ها به‌صورت فعلی می‌توانند در زمینهٔ مدارک پزشکی مفید واقع شوند، و به پرسش‌های کلیدی در زمینهٔ تشخیص افتراقی پاسخ دهند که در بالا به آن اشاره شد. ولی به‌سختی می‌توان فهمید که آیا پاسخ‌های داده شده ریشه در واقعیت‌های مربوطه دارد یا نه. پس این وظیفه بر عهدهٔ کلینیسین‌ها خواهد بود که کارهای چت‌بات را غلط‌گیری کنند، همان گونه که یادداشت‌هایی را هم که دیکته می‌کنند، باید غلط‌گیری کنند. مشکل آن است که این غلط‌گیری ممکن است از تخصص کاربر خارج باشد. غلط‌گیری یک یادداشت در ویزیت بیمار ممکن است به‌خوبی در حیطهٔ تخصص ارائه دهندگان خدمات باشد، ولی اگر سؤالی از ChatGPT به‌عنوان «مشاورهٔ کنار خیابان» پرسیده شود، تعیین صحتِ پاسخ بسیار دشوارتر خواهد بود.

کاربردی که بیشترین قابلیت و نگرانی را دارد، استفاده از چت‌بات‌ها برای تشخیص یا توصیهٔ درمانی است. کاربری که تجربهٔ بالینی ندارد، ممکن است نتواند به‌سادگی مطالب درست و نادرست را از هم تمییز دهد. هر دوی این مسائل در مقالهٔ لی و همکاران۱۱ مورد بررسی قرار گرفته است، و این مؤلفان نقاط قوت و ضعف استفاده از چت‌بات‌ها در پزشکی را بیان کرده‌اند. از آنجا که خود این مؤلفان سازندهٔ یک چنین سیستمی هستند، لذا ممکن است سوگیری هم در نظرات آن‌ها وجود داشته باشد.

با این وجود، ما بر این باوریم که چت‌بات‌ها تبدیل به ابزارهای مهمی در کار پزشکی خواهند شد. این ابزارها، مانند هر ابزار خوبی، می‌توانند به ما در انجام بهتر کارمان کمک کنند، ولی اگر به‌درستی از آن‌ها استفاده نشود، قابلیت آسیب رساندن هم دارند. از آنجا که این‌ها ابزارهایی جدید هستند و آزمایش کردن آن‌ها با روش‌های سنتی که در بالا گفته شد، سخت است، لذا جامعهٔ پزشکی هنوز در حال یادگیری نحوهٔ استفاده از آن‌ها است، ولی این یادگیری واجب است. تردیدی نیست که خود چت‌بات‌ها هم از کاربران خود چیزهایی خواهند آموخت. لذا پیش‌بینی ما این است که در طول مدتی، هم کاربران و هم خود ابزار مشغول سازگار شدن با شرایط خواهند بود.

نتیجه‌گیری

اعتقاد راسخ ما این است که ورود هوش مصنوعی و یادگیری ماشینی به پزشکی به متخصصان سلامت در بهبود کیفیت مراقبتی که ارائه می‌کنند، یاری رسانده است، و امید هست که در آیندهٔ نزدیک و پس از آن، بهبود باز هم بیشتری ایجاد کند. همان گونه که برداشت عکس‌های رادیولوژیک به‌وسیلهٔ کامپیوتر موجب حذف بایگانی کلیشه‌های رادیوگرافی و گم شدن عکس‌ها شده است، هوش مصنوعی و یادگیری ماشینی نیز می‌توانند پزشکی را متحول کنند. ما متخصصان سلامت ضمن استفاده از این فناوری جدید، نحوهٔ کار با هوش مصنوعی و یادگیری ماشینی را فرا خواهیم گرفت. هوش مصنوعی و یادگیری ماشینی کارشناسان سلامت را از کار بیکار نخواهد کرد؛ بلکه امکان آن را فراهم خواهد کرد که متخصصان سلامت کارشان را بهتر انجام دهند، و فرصت بیشتر برای تعامل چهره به چهره با بیماران داشته باشند، که این همان چیزی است که سبب می‌شود که این رشته برای ما ارزشمند و رضایت‌بخش باشد.

تأمین مالی و فاش‌سازی

فرم‌های فاش‌سازی که مؤلفان ارائه کرده‌اند، به‌همراه متن کامل مقاله در وب‌سایت NEJM.org موجود است.

وابستگی مؤلفان

برای تماس با دکتر هاوگ (Haug)، نمایندهٔ بین‌الملل مجلهٔ نیوانگلند، از طریق ایمیل charlottejohanne@gmail.com یا نشانی نروژ، اُسلو، کد پستی ۰۸۸۰، خیابان Åmotveien شمارهٔ ۶۳، اقدام نمایید.

مطالب تکمیلی

فرم‌های فاش‌سازی.

منابع

  1. Turing AM. Computing machinery and intelligence. Mind 1950;59:433-60.
  2. Yu K-H, Beam AL, Kohane IS. Artificial intelligence in healthcare. Nat Biomed Eng 2018;2:719-31.
  3. Brodman K, Van Woerkom AJ, Erdmann AJ Jr, Goldstein LS. Interpretation of symptoms with a data-processing machine. AMA Arch Intern Med 1959;103:776-82.
  4. Schwartz WB. Medicine and the computer — the promise and problems of change. N Engl J Med 1970;283:1257-64.
  5. Bowen JL. Educational strategies to promote clinical diagnostic reasoning. N Engl J Med 2006;355:2217-25.
  6. Pauker SG, Gorry GA, Kassirer JP, Schwartz WB. Towards the simulation of clinical cognition: taking a present illness by computer. Am J Med 1976;60:981-96.
  7. Schwartz WB, Patil RS, Szolovits P. Artificial intelligence in medicine. Where do we stand? N Engl J Med 1987;316:685-8.
  8. Rosenbaum L. Trolleyology and the dengue vaccine dilemma. N Engl J Med 2018;379:305-7.
  9. Liu X, Cruz Rivera S, Moher D, Calvert MJ, Denniston AK; SPIRIT-AI and CONSORT-AI Working Group. Reporting guidelines for clinical trial reports for interventions involving artificial intelligence: the CONSORT-AI extension. Nat Med 2020;26:1364-74.
  10. Cruz Rivera S, Liu X, Chan A-W, Denniston AK, Calvert MJ; SPIRIT-AI and CONSORT-AI Working Group. Guidelines for clinical trial protocols for interventions involving artificial intelligence: the SPIRIT-AI extension. Lancet Digit Health 2020;2(10):e549-e560.
  11. Lee P, Bubeck S, Petro J. Benefits, limits, and risks of GPT-4 as an AI chatbot for medicine. N Engl J Med 2023;388: 1233-9.

این یک مقاله‌ی مروری از سری مقالات «هوش مصنوعی در پزشکی» مجله‌ی پزشکی نیوانگلند است که در تاریخ ۳۰ مارس ۲۰۲۳ منتشر شده است.

منبع

Charlotte J. Haug, M.D., Ph.D., and Jeffrey M. Drazen, M.D. (March 30, 2023). “Artificial Intelligence and Machine Learning in Clinical Medicine, 2023” N Engl J Med 2023; 388:1201-1208 DOI: 10.1056/NEJMra2302038.