"החוכמה הקולית" כבר כאן: זיהוי קולי בבית ובעסק - במה לבחור?
מאת:
מיכאל פנחס, 13.6.19, 13:00
אילו יישומים ושירותים מופעלים ב"חוכמה קולית"? מה החידושים הטריים בתחום? מיהם הספקים של מוצרי זיהוי קולי ו-AI חכמים? איך משיגים חיסכון בהוצאות העסק ע"י מעבר ל"חוכמה קולית"?
לאחר ההצלחה של מוצרי
Alexa (אלכסה) של אמזון, ושל מכשירים בהם היא מובנית, עם מעל ל-100 מיליון מכשירים מבוססי "זיהוי קולי" ו-
AI (ר"ת:
Artificial Intelligence - "בינה מלאכותית"), שנמכרו בכל רחבי העולם (כולל בישראל), כל המתחרים נכנסו אף הם לשוק והחלו למכור מכשירים כאלה גם בישראל, ויש כבר בארץ כמה ספקים המוכרים ומתקינים מוצרי "חוכמה קולית" לבתים פרטיים ולעסקים.
מדובר בשוק חדש של
מכשירי ושירותי תקשורת המחוברים באינטרנט לענן (שבו נמצאת החוכמה -
AI). התחום החדש הזה מכונה גם בשם:
Personal Assistant ("עוזרת אישית"). הביקוש לפתרונות "חוכמה קולית" שהיה אפס, אך לפני מספר חודשים, מתחיל להמריא גם בישראל, במספרים גדלים והולכים.
מוצרי "החוכמה הקולית" משתלטים על הסלון שלנו, על המטבח, על החשמל, על החימום והמיזוג, על הרכב שלנו, על כל מה שיש במשרד שלנו, על מצלמות האבטחה, ועוד. בקיצור: כל דבר שיש בו חשמל, "החוכמה הקולית" יכולה להשתלט עליו ולנהל אותו ע"י פקודות קוליות שלנו, מרחוק, למעשה ממכל מקום בעולם, כל עוד יש לנו חיבור לאינטרנט.
מי מתחרה בתחום פתרונות ומוצרי "החוכמה הקולית"?
יש כיום 5 מערכות "חוכמה קולית" מתחרות מובילות של ספקיות עולמיות ענקיות, עם מוצרים ופתרונות, שנמכרים בהיקפים של עשרות מיליוני יחידות בשנה במספרים הולכים וגדלים (גם בישראל):
- Alexa, פתרון הזיהוי הקולי, ה-AI (והגאדג'טים), של חברת הענק אמזון.
- Google Assistance. פלטפורמה לזיהוי קולי מתקדמת, עם יכולת, שהוטמעה במוצרים רבים, כולל מוצרי חברת הבת של גוגל בשם Nest.
- Siri (או Hey Siri), פתרון מבית אפל המוטמע כמעט בכל קווי המוצרים של אפל.
- Cortana מבית מיקרוסופט. המערכת מוטמעת במוצרים רבים כולל מחשבים ניידים, אוזניות ומערכות Call Center (מוקדי שירות לקוחות).
- Bixby מבית סמסונג. מערכת המוטמעת במוצרי סמסונג היותר חדישים ושל חברות העובדות עם פתרונות של סמסונג.
בתחום מערכות הזיהוי הקולי לעסקים וארגונים, מי שמובילות את השוק הזה בעולם הן החברות:
Nuance, מיקרוסופט ו-
IBM ובישראל: חברת אודיוקודס.
היכולות של
זיהוי קולי (ובמקביל מערכות העונות בקול אנושי לפונה), הפכו ללהיט. כיום, רבים משתמשים ביכולות זיהוי בסמארטפון שלהם, החל מסירי (
Siri) - יכולת המצויה בכל המכשירים של אפל וכלה באיתור כתובת ב-
Waze.
תשובות קצרות לשאלות נפוצות:
1. למה זה בכלל אמור לעניין אותי?
משום שהעולם צועד קדימה והטכנולוגיה נועדה לשרת אותנו.
זה בדיוק כמו לשאול: בשביל מה אני צריך סמארטפון? הטלפון הישן עם החוגה לא מספיק?
לעסקים השאלה הזו הרבה יותר חשובה, מאשר עוד צעצוע - גאדג'ט בבית. בעסקים, אפשר לחסוך כסף, הרבה כסף, כשמשתמשים במוצרי "חוכמה קולית".
החיסכון יכול להיות בכל תחום, אבל בעיקר בתחומים הבאים:
- חיסכון באנרגיה, מה שמוריד דרסטית את ההוצאות על חשמל.
- ייעול התקשורת עם הלקוחות, מה שמוביל לגידול בהכנסות, הגדלת שביעות הרצון של הלקוחות ומניעת נטישת לקוחות לא מרוצים.
- שיפור בפריון העבודה (אפשרות לחסוך בעובדים ולהחליף אותם במכונות חכמות ורובוטים אנושיים).
- שיפור בתהליכי העבודה ובקשר בין מנהלים ועובדים ובינם לבין עצמם.
2. אילו חידושים טריים יש בתחום מוצרי "החוכמה הקולית"?
חידוש די טרי (כרגע בארה"ב ויחל בקרוב בעוד כמה ארצות בעולם, יגיע אלינו בהמשך השנה), הוא פיצ'ר חדש במערכת ה-
Personal Assistance של גוגל. חברת גוגל החלה לתת למשתמשים אמתיים לבדוק את ה-
Google Duplex היכול להתקשר במקומכם למסעדות ולמספרות, ולמשל, לקבוע תורים בשמכם. זו מערכת מבוססת
AI (בינה מלאכותית), שניתן באמצעותה לקבוע תורים ע"י בקשה מהעוזרת הקולית של גוגל, והיא זו שעושה את השיחה בשבילכם, במקומכם.
איך זה עובד? מאוד פשוט. כל שעל המשתמש לעשות הוא לבקש מהעוזרת הקולית להזמין מקום למסעדה ביום ובשעה, שהוא מעוניין, ולציין כמה מקומות הוא מזמין. העוזרת הקולית מתקשרת בעצמה בטלפון למסעדה, ומנהלת שיחה בזמן אמת עם הנציג האנושי של המסעדה
. גוגל החליטה, שהמערכת תזדהה בתחילת השיחה כמערכת ממוחשבת, כדי שאף אחד לא יטעה לחשוב, שהוא מדבר עם בן אנוש, בעוד הוא מדבר עם מחשב.
בנוסף, גוגל פועלת במהירות מול אמזון, המתחרה הגדולה שלה, והחלה לחשוף שיתופי פעולה חדשים, והבולט שביניהם הוא עם חברת
,Lenovo שיצרה את ה-
Lenovo Smart Clock . זהו שעון מעורר חכם, שמיועד לחדר השינה. הוא בעל מסך מגע בגודל 4 אינץ’, על גביו הוא מציג לכם מידע וזמני שעון מעורר מומלצים, על פי הרגלי השינה שלכם. בנוסף להיותו רמקול חכם עם העוזרת הקולית, בגוגל מסבירים, שהמסך יעלה את רמת הבהירות שלו לאט-לאט לקראת ההשכמה שלכם, כדי להעיר אתכם עם אור עדין שיבשר לכם שהגיע הבוקר. השעון המעורר החדש יוצע למכירה באביב הקרוב.
גוגל חשפה את מצב ה-
Interpreter במוצרי "החוכמה הקולית" של החברה. במצב זה, שיהיה זמין רק במכשירי
,Google Home תוכלו לבקש מהעוזרת הקולית לעזור לכם לשוחח עם אנשים בעשרות שפות זרות. המכשיר עצמו יתרגם בין השפות באופן שקוף. גוגל דיווחה, שהיא החלה פיילוט עם מספר מלונות, בהם יוצבו מכשירים של גוגל בעמדות השירות. כך, שיסייעו לאורחים זרים לנהל שיחות עם נציג המלון, שעומד מולם, כשכל צד מדבר בשפה שונה.
גוגל גם חברה ל
United Airlines-ולרשתות מלונות, כדי שתוכלו לבקש מהעוזרת הקולית לעשות עבורכם את הצ’ק אין לטיסה בלי שתצטרכו להזין מספר אישור הזמנה, וגם להזמין חדר במלון ביעד אליו אתם טסים. העוזרת תשלוף את המידע הנחוץ מהאימייל שלכם, ותבצע את התהליך בעצמה ותציג בפניכם את כרטיס העלייה למטוס. כמובן, שתוכלו גם להזמין מלון באמצעות העוזרת הקולית בעזרת הקול בלבד
.
גוגל גם רוצה להיכנס למכונית שלנו, וחשפה שיתוף פעולה נוסף עם חברת
,Anker שמוכרת מתחום הסוללות והמטענים ועם קו מוצרי
,JBLשהם מכשירים קטנים המתחברים למצת הרכב, ומלבד היכולת להטעין באמצעות
USB את המכשיר, הם מתחברים למערכת המדיה של הרכב דרך בלוטוס’ או
,AUX אם אין לכם מערכת חדשה מספיק. לאחר שתחברו אותם למכשיר שלכם פעם אחת, תוכלו להשתמש בעוזרת הקולית ברכב בלי שום בעיות, כאשר באמצעות מיקרופון ומנגנון ניקוי רעשים, העוזרת הקולית תוכל לשמוע ולהבין אתכם גם כאשר ישנה מוזיקה חזקה ברקע. לאחר שתתנו פקודות לעוזרת, מסך הסמארטפון שלכם לא יציג מידע רב ויסיח את דעתכם, אלא יתבסס יותר על פידבק קולי, כדי לתת לכם להתרכז במה שחשוב, הנהיגה עצמה. ה
Bolt-מוצע תמורת 50 דולרים.
בקיצור: גוגל, כמו גם מתחרותיה, רוצה להגיע עם העוזרת הקולית שלה לכל מקום: למטבח, לסלון, לרכב, למלונות, לשדות תעופה, לאוזניות, למסכים, לרכב, למשרד, ועוד. זוהי רק ההתחלה
.
פיתוח מעניין נוסף הוא של
IBM, שמספק יכולת ניהול ויכוח על כל נושא עם כל אדם. המערכת נועדה לשפר את תהליכי קבלת ההחלטות בכל נושא. זו "בינה מלאכותית" -
AI בשילוב "זיהוי דיבור", שמסייעת לקבלת החלטות.
המערכת החדשה של
IBM נקראת Project Debator - Speech by Crowd. זה השלב הבא בפיתוח כלי בינה מלאכותית המסייעים לתהליכי קבלת החלטות. מדובר בהמשך הישיר של
Project Debater - פלטפורמת הבינה המלאכותית הראשונה בעולם, שהצליחה לקיים
debate (ויכוח) עם בן אדם על נושאים מורכבים, ופותחה במעבדת המחקר של החברה בחיפה.
Speech By Crowd היא פלטפורמת בינה מלאכותית המסוגלת לאסוף טיעונים קצרים ומגוונים בטקסט חופשי מקבוצה גדולה של אנשים ולייצר מהם 2 נאומים בני 2-3 דקות כל אחד - אחד בעד הנושא הנדון והשני נגדו. הכלי החדש, שפועל בענן, פותח, כאמור, כדי לאפשר שימוש בבינה מלאכותית וחוכמת המונים לתמיכה בתהליכי קבלת החלטות בנושאים מורכבים.
כדי להדגים את הכלי החדש, מזמינה
IBM כל אדם בעולם להיכנס לאתר של
Speech By Crowd ולהעלות לשם את הטיעון שלו, בנושא הנדון.
סייעני בינה מלאכותית הפכו שכיחים בחיי היומיום שלנו, עבור משימות כמו: חיפוש תמונות, או ריענון והתאמה אישית של פלייליסטים. יישומי בינה מלאכותית יכולים כיום גם לסייע לעסקים בניתוח נתונים או שירות לקוחות.
Project Debater הרחיב את היכולות הללו לתמיכה בקבלת החלטות מבוססת טקסט, אולם יש להן גם פוטנציאל בתחומים רבים נוספים. עיריות, למשל, שמבקשות להבין לעומק את עמדות התושבים בשאלות על מדיניות מוצעת; חברות הרוצות לאסוף תובנות מדויקות יותר על עמדתם של הלקוחות לקראת השקה של מוצר או שירות חדש; או ארגונים המבקשים מהציבור משוב של שביעות רצון.
3. האם יש חידושים כאלה גם בישראל?
בהחלט. חברת
Robotemi הישראלית, שפיתחה רובוט אישי המבוסס על בינה מלאכותית, שמשלב יכולות של סייענות חכמה וניידות אוטונומית לצרכן הסופי ולעסקים, הכריזה על התחייבותה לשלב את
Alexa ולייצר חווית
Echo Show-like ברובוט האישי
temi, כאשר מערכת
Smart Screen ומכשיר הטלוויזיה
SDK של
Alexa ישוחררו. חיבור זה יהפוך את
temi לאחד מהרובוטים הראשונים המשלבים את טכנולוגיית
Alexa, וירחיב את יכולות הרובוט ויהפוך אותו לחלוץ בעידן החדש של רובוטים עוזרים.
הרובוט הישראלי שגובהו כמטר ומשקלו 12 ק"ג, מכיל 16 סנסורים ייחודיים מעולם הרובוטיקה הכוללים חיישן לייזר 360 מעלות מתקדם ומספר מצלמות עומק, ומשלב בתוכו משטח הטענה לסלולר, נטען באופן עצמאי, ותוכנן במקור כדי לסייע לקשישים. אך החברה זיהתה את הפוטנציאל ומגוון האפשרויות הגלומות בו, ביניהן יכולת ה-
Telepresence, קיום שיחות וידאו ללא ידיים, שמחבר בין משפחות, שלא נמצאות תחת קורת גג אחת, שמאפשרות למשתמש לבלות זמן רב יותר בתקשורת פנים אל פנים, וכתוצאה מכך, לבנות או לשפר את היחסים עם בני משפחה, חברים, עובדים ועוד.
"
temi" הוא מוצר חלוצי בתחום הרמקולים החכמים. לעומת
Alexa Show,
Google Home ו
Portal- של פייסבוק ,שהם מוצרים נייחים,
"temi" הוא מוצר נייד. התנועות האוטונומיות שלו ומאפייני האינטראקציה האנושית-רובוטית מאפשרים יישומים רבים. בעזרת אפליקציית
temi יכולים המשתמשים להניע את הרובוט מכל מקום בעולם ברחבי הבית או המשרד ולנהל שיחות וידאו ללא שימוש בידיים, קבלת פנים במשרד/בתי מלון/שדות תעופה, סיוע לקשישים מרחוק, נשיאת דברים ממקום למקום, לימוד שפות, משחקים אינטראקטיביים, אבטחה, תמיכה בחנויות ובתי עסק, לסייע לרופא לבקר חולים הנמצאים בביתם, לצד מגוון שימושים רבים נוספים לעסקים ולקידום מכירות. ובעצם כל דבר, שתנועה במרחב באופן אוטונומי יכולה לסייע.
ראוי לציין, שאחת השחקניות המובילות בארץ בתחום היא אודיוקודס, שהכריזה לאחרונה על מהלך של הוספת AI -
Artificial Intelligence - אינטליגנציה מלאכותית, למערכות
זיהוי דיבור של החברה, ליצירת קו חדש של פתרונות לשוק והוקמה בחברה חטיבה חדשה בשם Voice.AI לצורך ההתפתחות המבטיחה הזו. זה חלק מהתפתחות תחום
שירותי התקשורת בענן.
מאת: מיכאל פנחס, מהנדס תקשורת, יוני 2019.
מחבר המדריך לפתרונות תקשורת ומחשוב ענן ולרכישת מרכזיות טלפון IP לעסקים