מכללת אפקה בת"א חושפת את החידושים בתחום "זיהוי דיבור" - Speech Technologies, שעברו משלב המחקר לשלב היישום בעולם הרפואה eHealth ובמקצועות תומכי רפואה דוגמת תרפיה וקלינאי תקשורת, עם יישומים חדשים ומלהיבים, גם לאבחון מחלות וגם לטיפול ולריפוי.
מאת:
אבי וייס, 19.1.17, 13:58
המכללה להנדסה אפקה בת"א, שהפכה בשנה החולפת ל"
מרכז לאומי לזיהוי דיבור" בשת"פ
מערכת הביטחון, ממשיכה לקדם את הפיתוחים, המחקרים והסיוע לתעשייה בתחום "
זיהוי דיבור".
אחד החידושים המרתקים ביותר נחשף בכנס "זיהוי דיבור בתחום הרפואה", שנערך במכללה בהשתתפות עשרות רבות של חוקרים ומומחים בתחום וסטארטאפים המפתחים פתרונות בתחום הזה והוא
NiNiSpeech, מיזם המפתח פתרון לבעיית הגמגום ככלי יישומי לקלינאי תקשורת, גם באמצעות אפליקצית סלולר.
פרופ'
עמי מויאל, (בתמונה משמאל),
נשיא מכללת אפקה: "העובדה, שאנו מדברים כאן במכללה על 'זיהוי דיבור' בעולם הרפואה, היא מאוד משמעותית עבורנו ועבור התעשייה. זו פעם שנייה, שאנו עורכים כנס מקצועי הממוקד בתחום הזה, כי אנו תומכים ומובילים אותו.
הכיוון הזה הוא חלק מהאסטרטגיה שלנו ליצור קשר חזק בין האקדמיה לתעשייה. זה גם מסייע ברמה הלאומית, משום שאנו מוכיחים, שזה אפשרי, שהאקדמיה לא תפעל בנפרד ובמנותק מהתעשייה.
לכן, מנקודת המבט הזו, אנו הזמנו בשנה החולפת מעל ל-5 אלף תלמידי תיכון לבקר במעבדות שלנו ואנו פועלים כדי לחזק אצלם את האמונה בעצמם, שהם יכולים להצליח בלימודי הנדסה. זו הסיבה, שהפכנו למכללה להנדסה המבוקשת ביותר בקרב הנרשמים ללימודי הנדסה בישראל.
אנו מקדמים את המחקר שלנו בתחום הזה בעיקר דרך פלטפורמות המחקר שלנו. הקמנו עד היום 9 מרכזי מחקר, ובמיוחד התחום הזה של זיהוי דיבור מפותח במרכז
ACLP (ר"ת: Afeka Center for Language Processing). המדובר במרכז מחקר מוכוון תעשייה ולמען התעשייה. אנו מעודדים את הסטודנטים שלנו לחקור ולעבוד ביחד עם התעשייה ולמצוא פתרונות נכונים לבעיות, שהתעשייה מציבה בפנינו. אנו
מאוד מעשיים בגישה שלנו.
כדי להתקדם בתחום "
זיהוי דיבור" בעולם הרפואה, חובה עלינו לבצע מהלכים של החלפת מידע עם כל מה שנעשה בתחום זה בעולם, כי זה תחום, שלא מוכר כל כך ומעטים כותבים על כך. השילוב של המחקר בזיהוי דיבור ועולם הרפואה לא מוכר גם לעוסקים ברפואה. אולם, התחום הזה צומח מהר ואני שמח לראות, שיש כבר עשרות אנשים העוסקים בתחום הזה בישראל.
את מרכז המחקר ACLP הקמנו עם 2 אנשים, שאני הייתי אחד מהם, והתחלנו את זה מתוך אהבה והתמכרות מוחלטת לתחום עם שילוב של כיף מחקרי. בהמשך התפתחנו וכיום החוקרים התפתחו ושינו כוון לתחומים חדשים, שלא חשבנו עליהם בעת הקמת המכון. אלה תחומים, שבכלל לא הכרנו אותם בעבר בעולם זיהוי הדיבור דוגמת "
עוזר אישי". איש לא חשב, שזיהוי דיבור יש לו איזה שימוש בעולם הרפואה. כיום, זו עובדה מוכחת, שכבר לא דורשת שכנוע.
אני מודה לכל מי שעוסק במלאכה ומוכן לקדם את התחום הזה הנמצא בצעדיו הראשונים והמאוד מבטיחים בישראל".
ד"ר
עירית עופר, (בתמונה משמאל), ראש מרכז אפקה לעיבוד שפה (ACLP): "אני חייבת תודות קודם כל לאורחי הכבוד שלנו, שהגיעו מרחבי העולם ובמיוחד לפרופ'
Isabel Trancoso, שהגיעה אלינו מפורטוגל, שמובילה בתחום הזה ותחזק את הידע ממה שהיא חוקרת ומפתחת.
אנו כאן בארץ באפקה עובדים כצוות משימה כדי לקדם את התחום בו אנו עוסקים. נכנסנו לאחרונה לתחומים חדשים ומלהיבים ואחד מהם הוא זיהוי דיבור בעולם הרפואה.
מרכז ACLP פועל כבר מעל -7 שנים ומכסה את כל התחומים המחקריים והיישומיים בעולם זיהוי דיבור, כאשר בשנתיים האחרונות נכנסנו עמוק ל-2 תחומים חדשים, מלהיבים וממוקדים:
א. זיהוי מחלות על בסיס הקול של החולה - המטופל. יש כאן התפתחות עצומה ומאוד מעניינת המייתרת בדיקות פולשניות ולא פולשניות ויקרות לזיהוי מחלות. ניתן היום לזהות הרבה מחלות על סמך ניתוח הדיבור, כולל סרטן.
ב. שימוש בזיהוי דיבור לעולם הרפואה, בדגש על ריפוי חולים וזיהוי מצב החולים בתחומים ספציפיים, שהמחקר מראה, שהטכנולוגיה הזו אכן עוזרת לחולים להתרפא.
ההתפתחות הזו, שאנו רק באמצעיתה, מלווה בעזרה של חברות רבות מהתעשייה. כיום אנו מרחיבים את השת"פ גם עם עולם הרפואה דוגמת בתי חולים, מכוני מחקר, מכוני טיפול וריפוי ואנו מרחיבים את התש"פ עם עוד חברות בתעשייה המקיפה את עולם הרפואה כמו תעשיית התרופות ותעשיית הציוד הרפואי.
הבסיס לעבודה שלנו: מידע רפואי דורש אימות כמו כל מידע רפואי. לכן, כשאנו באים עם טכנולוגיות זיהוי דיבור, אנו צריכים להפיק מידע מספיק, שניתן להפעיל עליו כלים מדעיים וסטטיסטיים כדי להפיק ממנו תובנות, כמו כל ניתוח מידע בעולם הרפואה. זה האתגר הגדול ביותר, שאנו מתמודדים עמו כעת ואני מאוד אופטימית בהתפתחות של התחום הזה אצלנו ובעולם הרפואה".
פרופ'
איזבל טרנקוסו (
Isabel Trancoso), (בתמונ
ה משמאל), מכון המחקר
INSEC-ID, פורטוגל: "התחום של
יישום אפליקציות קול ברפואה הוא התחום המרתק ביותר, שבו אני עוסקת מזה מספר שנים לא קטן עם צוות שלם הגדל והולך. ה
שימוש של זיהוי דיבור ב-eHealth כבר החל להתפשט בעולם, כי אנו במצב, שבו יש כבר (וגם אצלנו) רובוטים אנושייים המלווים חולים ועוזרים לחולים. רובוטים העוזרים לזקנים ולילדים קטנים כבר מופעלים בכמויות די יפות, למשל, ביפן.
התחום בו אנו מתרכזים בפיתוחים וביישומים שלנו נעים סביב
נושאי התרפיה ונושאי הדיאגנוסטיקה. התחלנו עם זיהוי שינויים בקול כתוצאה מפגיעה במערכת הדיבור האנושית של החולה מסיבות שונות, כולל ממחלות ותאונות.
השימוש הראשוני של יישום טכנולוגיות זיהוי דיבור היה מכוון לילדים, כדי ללמד אותם לתקן טעויות דיבור, או בעיות בדיבור, בעיקר במחלות דוגמת
דיסקלציה ואפילו ברמות הבסיסיות של שיבושים בהגיית מילים אצל ילדים. בתחום זה יש לנו כבר מספיק ידע ונתונים שמוכיחים הצלחה ולכן התקדמנו לכיוון הטיפול במבוגרים.
מצאנו קשר בין שיבוש בדיבור לכמה סוגי מחלות, כולל מחלות קשות דוגמת
סרטן הגרון.
הכניסה של הטכנולוגיה, שהחלה בטיפול בילדים, אל האוכלוסיות המבוגרות נובעת מכך, שב-2050 כ-22% מהאוכלוסיה בעולם המערבי יהיו מעל לגיל 60 ויש באוכלוסייה הזו הרבה מחלות, החל מאלצהיימר דרך פרקינסון ועוד, מחלות הפוגעות בדיבור ומעוותות את הדיבור של החולים. כבר היום, כ-12% מהאוכלוסייה מעל לגיל 65 סובלת מאלצהיימר או מפרקינסון. אלו מספרים ממש גדולים ובדקנו איך אנו יכולים לסייע לאוכלוסיות הללו.
ב-2012 התחלנו בלימוד ובפיתוח שיטות לתיקון הדיבור של חולים מבוגרים, באמצעות טכנולוגיות זיהוי דיבור. מאז, התחום הזה התקדם מאוד, עם בסיסי מידע גדולים ויש כיום כמה בסיסי מידע הפתוחים לציבור המקצועי דוגמת DementisBank, שיש בהם כלים המשמשים למבחנים לזיהוי ולטיפול ב
דמנציה מכל הסוגים וגם ב
פרקינסון.
במחלת הפרקינסון חלה התקדמות רבה, בעיקר בתחום הדיאגנוסטיקה באמצעות הקול ויש כבר כמה מבחנים מוכרים, שעברו את כל הבחינות ויש עוד כמה מבחנים הנמצאים בתהליכי הכרה ואישור. ההצלחה בזיהוי בכלים הללו עומדת על 87%. זה מאוד גבוה מול מבחנים אחרים, שיש בתחומים הללו כולל בתחום הפרקינסון.
אחד התחומים המרכזיים, שאנו חוקרים ומפתחים כיום, הוא מחלה הנובעת
משבץ מוחי, או מסרטן, או מתאונה ושמו של התחום הזה אצלנו הוא: VITHEA. אנו מפתחים פתרונות תרפיה לתחום הזה ועמדו בפנינו הרבה אתגרים לפתור, כדי שנוכל לספק פתרון משביע רצון ואפקטיבי. פיתחנו מערכת אוטומטית לזיהוי המחלה וכרגע אנו משכללים את הדיוק שלה לאור המידע הנצבר.
כיום, 16 חולים מטופלים במערכת, שאנו מפתחים. האפליקציה נראית מבחוץ כמו
צ'אט-בוט, וזו צורת החיבור שלה עם החולה, חיבור, שנעשה על כל מסך כולל מסך
סמארטפון, עם קישור לאינטרנט בכל רשת כולל WiFi וסלולר. היופי בפתרון, שניתן ליישם אותו בכל מקום, גם בבית של החולה והוא יכול לבד לבצע את התרגילים של המערכת. אפשר לפתח תרגילים חדשים די בקלות, ע"י כל תרפיסט, שעוזר לחולים הללו, כי זו מערכת מלהיבה וקלה לתפעול, כמו כל צ'אט-בוט.
המערכת הזו מתפתחת ומיועדת להפעלה ב-4 בתי חולים בפורטוגל עם כ-160 חולים ויש בה כבר כ-1,900 תרגילים. זה למעשה
תרפיסט וירטואלי בדמות אישה וזה מאוד מצליח ומתפשט בין המטפלים. אנו התבקשנו לפתח גרסאות נוספות למערכת, למשל, לילדים עם
אוטיזם.
העיסוק במערכת הזו הוביל אותנו לעסוק במבחנים
בתחום הנאורו-פסיכולוגי. הבסיס היה במערכת VITHEA, עם התאמות, שנדרשנו לבצע לאנשים, שיש להם תגובה איטית בידיים, למשל בלחיצה על העכבר או על המסך. היינו צריכים להתאים את המערכת לסוגים שונים של אנשים וזה הוביל אותנו לפתח פרופילים במערכת, כדי להתאים אותם לסוגים השונים של החולים. אנו עדיין לא סיימנו לפתח את המערכת כדי שתהיה ידידותית בכל סביבה ולכל החולים, גם בסביבות קשות לתפעול דוגמת חולים הנמצאים במסדרונות של בתי החולים או במיון, שם יש המון רעש.
פתרון נוסף, שאנו עובדים עליו. הוא פתרון
מכוון לילדים בשם VITHEA-Kids. כאן בנינו מערכת, שתהיה יותר מצחיקה ומושכת ויזואלית את הילדים. זה הצריך החלפה של כל המראה -
UI של המערכת והתאמת התכנים לעולמות התוכן של הילדים, עולמות תוכן המשתנים כל הזמן. אנו כרגע בשלב של אימות של המערכת עם כמה ילדים מטופלים.
פרויקט נוסף שלנו הוא: BioVisualSpeech Project, שזה פרוייקט המכוון
לתרפיסטים המפעילים ילדים מול מראה, זה סוג של טיפול די מקובל אצל תרפיסטים. כאן אנו מחליפים את המראה במצלמה ומסך וזה הופך להרבה יותר ידידותי לילדים.
אנו עובדים על הרחבת המערכת הזו לכיוון של
מחלת ה-ALS, ואנו בתחית הדרך בכיוון הזה. חולי ALS הם חולים מאוד קשים עם אבדן יכולת הדיבור. הפתרונות הקיימים כיום הם מאוד יקרים ומסורבלים.
אנו מפתחים מערכת אבחון לילדים עם
ASD, זו מערכת המפותחת כרגע ע"י אחד הסטודנטים הנמצאים אצלנו. יש לנו גם קבוצה שעובדת עםן אוניברסיטה, שמפתחת פתרון
לילדים דיסלקטיים.
פתרון נוסף, שמפותח, הוא בעולם ה-
Bipolar Disorder, שזו מחלה די נפוצה של 'פיצול אישיות' כסוג של 'מאניה-דיפרסיה'. בתחום המחלות הפסיכיאטריות זו מחלה די נפוצה ויש קושי לרופאים לזהות את התפתחות שלבי המחלה של החולים בתחום הזה. בניתוחים, שאנו עורכים, מצאנו, שיש הבדל בביטויים של הדיבור בין אנשים בריאים לאנשים חולים בשלבים השונים של המחלה. זה מוביל לכלי אבחון הנמצא כרגע בפיתוח.
לאור ההתפתחות של המידע, שאנו אוגרים ומנתחים,יש לנו מחשבות לפתח את התחום וליישם בו רעיונות, שיש כיום בתחום לימוד שפות ולפתח מבחנים בהיקף נרחב בשפות שונות. כך, שיתאימו לכל האוכלוסיות בעולם ובמגוון רחב של מחלות הדורשות אבחון וטיפול. הכיוון הכי יישומי, שאנו עובדים עליו, הוא פיתוח משחקים תוך שימוש ב-
3D. אלה רעיונות, שראינו שיש בתחום לימוד שפות ואנו מטמיעים את הטכנולוגיות הללו במערכות, שאנו מפתחים.
לסיכום, הפלטפורמה המרכזית שלנו היא VITHEA, ממנה התחלנו להתפשט לתחומים רבים. יש לנו עד כה תוצאות די יפות, אבל אנו צריכים להשקיע רבות בשיפור הידידותיות של המערכת והתאמה הפרסונלית למגבלות וליכולות של כל אדם המשתמש במערכת, בין אם הוא רופא, תרפיסט, חוקר או חולה.
למיטב הערכתי, תחום זיהוי דיבור יכול להשפיע ולקדם את הרפואה והוא ייכנס די מהר
לכל התחומים של הרפואה המודרנית. אני קוראת לכל מי שעוסק בתחום להיכנס וללמוד על מה שפיתחנו בלינק של
אתר VITHEA ונשמח לשתף פעולה עם מה שנעשה ומפותח בתחום הזה בישראל".