افزایش محبوبیت برنامه‌های تبدیل گفتار به متن

برنامه‌های تبدیل گفتار به متن (STT) به طور فزاینده‌ای در کارهای روزمره مانند دیکته‌نویسی بدون استفاده از دست، کمک به افراد نابینا و رونویسی گفتار برای کسانی که شنوایی ضعیفی دارند، محبوب شده‌اند. این ابزارها کاربردهای فراوانی دارند و محقق بوزنا کستک از دانشگاه فناوری گدانسک در حال بررسی بهترین راه‌های استفاده از STT در حوزه پزشکی است. او با مطالعه تأثیر گفتار واضح بر دقت STT، امیدوار است بتواند کاربرد آن را برای متخصصان بهداشت و درمان بهبود بخشد.

اهمیت خودکارسازی یادداشت‌برداری در پزشکی

کستک می‌گوید: “خودکارسازی یادداشت‌برداری برای داده‌های بیماران برای پزشکان و رادیولوژیست‌ها بسیار حیاتی است، زیرا این کار زمان بیشتری را برای تعامل رو در رو با بیماران فراهم می‌کند و امکان جمع‌آوری بهتر داده‌ها را مهیا می‌سازد.”

چالش‌های موجود در استفاده از STT در پزشکی

کستک همچنین به چالش‌های موجود در این زمینه اشاره می‌کند: “مدل‌های STT اغلب با اصطلاحات پزشکی، به ویژه در زبان لهستانی، مشکل دارند؛ چرا که بسیاری از آن‌ها عمدتاً بر روی زبان انگلیسی آموزش دیده‌اند. همچنین، بیشتر منابع به زبان ساده توجه دارند و نه واژگان تخصصی پزشکی. محیط‌های شلوغ بیمارستان نیز کار را دشوارتر می‌کند، زیرا ارائه‌دهندگان خدمات بهداشتی ممکن است به دلیل استرس یا حواس‌پرتی به وضوح صحبت نکنند.”

تصویری از یک صحنه شلوغ بیمارستان که در آن متخصصان بهداشت و درمان با استفاده از فناوری تبدیل گفتار به متن با بیماران در حال تعامل هستند.
مهمترین تنظیمات پزشکی با استفاده از تکنولوژی تبدیل گفتار به متن.

ایجاد پایگاه داده صوتی تخصصی

برای مقابله با این چالش‌ها، یک پایگاه داده صوتی دقیق از اصطلاحات پزشکی لهستانی که توسط پزشکان و متخصصان در زمینه‌های مختلفی از جمله قلب‌شناسی و ریه‌شناسی صحبت شده، ایجاد شده است.

📢 اگر عاشق علم هستید و نمی‌خواهید هیچ مقاله‌ای را از دست بدهید…

به کانال تلگرام ما بپیوندید! تمامی مقالات جدید روزانه در آنجا منتشر می‌شوند.

📲 عضویت در کانال تلگرام
پاپ‌آپ اطلاعیه با اسکرول

تحلیل داده‌ها با استفاده از مدل شناسایی گفتار خودکار

این مجموعه داده‌ها با استفاده از یک مدل شناسایی گفتار خودکار تحلیل شده‌اند، فناوری‌ای که گفتار را به متن تبدیل می‌کند. برای ارزیابی کیفیت شناسایی گفتار، چندین معیار مانند نرخ خطای کلمات و نرخ خطای کاراکترها مورد استفاده قرار گرفت. این تحلیل به ما کمک می‌کند تا درک کنیم که چگونه وضوح و سبک گفتار بر دقت تبدیل گفتار به متن (STT) تأثیر می‌گذارد.

تصویری از یک متخصص بهداشت و درمان که در حال بررسی چالش‌های فناوری شناسایی گفتار در محیط بیمارستان است.
چالش‌های موجود در بهره‌برداری از فناوری گفتار در پزشکی.

ارائه داده‌ها در جلسه مجازی

کستک قرار است این داده‌ها را روز پنجشنبه، ۲۱ نوامبر، ساعت ۳:۲۵ بعدازظهر به وقت شرقی به عنوان بخشی از جلسه مجازی ۱۸۷ ام انجمن آکوستیک آمریکا که از ۱۸ تا ۲۲ نوامبر ۲۰۲۴ برگزار می‌شود، ارائه کند. او در این باره گفت: “اصطلاحات پزشکی می‌توانند پیچیده باشند، به خصوص با اختصاراتی که در تخصص‌های مختلف متفاوت است. این کار زمانی که به شرایط واقعی بیمارستان اشاره می‌کنیم که اتاق به صورت آکوستیکی آماده نیست، حتی دشوارتر می‌شود.”

تمرکز بر زبان‌های مختلف

در حال حاضر، تمرکز بر روی زبان لهستانی است، اما برنامه‌هایی برای گسترش تحقیقات به زبان‌های دیگر مانند چکی وجود دارد. همکاری‌هایی با بیمارستان دانشگاهی برنو در حال شکل‌گیری است تا منابع اصطلاحات پزشکی توسعه یابد و هدف آن افزایش استفاده از فناوری STT در حوزه بهداشت و درمان است.

تصویری از یک رابط پایگاه داده صوتی با نمایش اصطلاحات پزشکی و فناوری‌های تحلیل گفتار.
توسعه پایگاه داده صوتی دقیق برای بهبود تشخیص گفتار در محیط‌های بهداشتی.

چالش‌های هوش مصنوعی

کستک افزود: “اگرچه هوش مصنوعی در بسیاری از موقعیت‌ها مفید است، اما باید بسیاری از مشکلات به صورت تحلیلی و نه ترکیبی بررسی شوند و تمرکز بر شکستن یک تصویر کلی به اجزای فردی باشد.”

مقاله های شبیه به این مقاله

بیشتر بخوانید

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *