אלקסה, סירי, ו- Google לא מבין מילה שאתה אומר

אמזון

עוזרי קול כמו Alexa, Google Assistant, ו Siri יש כברת דרך ארוכה בשנים האחרונות. אבל, על כל השיפורים שלהם, דבר אחד מחזיקה אותם בחזרה: הם לא מבינים אותך. הם מסתמכים יותר מדי על פקודות קוליות ספציפיות.

זיהוי דיבור הוא רק טריק הקסם

אמזון

עוזרי קול לא מבינים אותך. לא ממש, בכל אופן. כאשר אתה מדבר על דף הבית של Google או אמזון הד, זה בעצם ממיר את המילים שלך למחרוזת טקסט ולאחר מכן משווה את זה לפקודות הצפויות. אם הוא מוצא התאמה מדויקת, לאחר מכן הוא עוקב אחר הוראות. אם זה לא, הוא מחפש חלופה של מה לעשות על סמך איזה מידע יש לו, ואם זה לא עובד אתה מקבל הודעת כישלון כגון "אני מצטער, אבל אני לא יודע את זה "זה קצת יותר מלטף של קסם יד כדי להערים עליך לחשוב שהוא מבין.

הוא אינו יכול להשתמש ברמזים הקשריים כדי לנחש את הטוב ביותר, או אפילו להשתמש בהבנה של נושאים דומים כדי ליידע את החלטותיו. זה לא קשה לעבור גם עוזרי קול. למרות שאתה יכול לשאול את Alexa "האם אתה עובד עבור NSA?" ולקבל תשובה, אם אתה שואל "האם אתה חלק בסתר של NSA?" אתה מקבל "אני לא יודע את זה" תגובה (לפחות ב זמן כתיבת שורות אלה).

בני אדם, שמבינים באמת את הדיבור, לא עובדים ככה. נניח שאתה שואל אדם, "מה זה klarvain בשמים? זה מקושת, ומלא בצבעים מפוספסים כמו אדום, כתום, צהוב וכחול ". למרות קלרוויין להיות מילה מורכבת, האדם שביקשת עשוי להבין מתוך ההקשר כי אתה מתאר קשת.

בעוד שאתה יכול לטעון כי אדם הוא המרת דיבור לרעיונות, אדם יכול ואז ליישם ידע והבנה כדי לסיים את התשובה. אם אתה שואל אדם אם הם בסתר לעבוד עבור NSA, הם יתנו לך תשובה כן או לא, גם אם התשובה היא שקר. אדם לא אמר "אני לא מכיר את זה" לשאלה כזאת. כי בני האדם יכולים לשקר הוא משהו שמגיע עם הבנה אמיתית.

עוזר קול לא יכול ללכת מעבר תכנות שלהם

עוזרי הקול מוגבלים בסופו של דבר לפרמטרים צפויים מתוכננים, ונדודים מחוץ להם ישבור את התהליך. עובדה זו מראה כאשר התקני צד שלישי באים לשחק. בדרך כלל, הפקודה אינטראקציה עם אלה הוא מאוד מסורבל, בהיקף של "אומר ליצרן המכשיר הפקודה הארגומנט אופציונלי." דוגמה מדויקת יהיה: "תגיד מערבולת כדי להשהות את המייבש." עבור אפילו יותר לזכור את הדוגמה, ג'נבה Alexa מיומנות שולטת כמה תנורים GE. משתמש של מיומנות צריך לזכור "לספר ז'נבה" לא "לספר GE" ואז את שאר הפקודה. ובעוד אתה יכול לבקש את זה כדי לחמם את התנור ל 350 מעלות, אתה לא יכול מעקב עם בקשה להגביר את הטמפרטורה ב 50 מעלות נוספות. אדם יכול לעקוב אחר בקשות אלה אף.

אמזון וגוגל עבדו קשה מאוד כדי להתגבר על המכשולים האלה, וזה מראה. איפה פעם היית צריך לעקוב אחר רצף לעיל לשלוט נעל חכם, עכשיו אתה יכול להגיד "לנעול את הדלת הקדמית" במקום. אלכססה היתה מבולבלת על ידי "תגיד לי בדיחה לכלב", אבל לבקש אחד היום, וזה יעבוד. הם הוסיף וריאציות לפקודות אתה משתמש, אבל בסופו של דבר אתה עדיין צריך לדעת את הפקודה הנכונה לומר. אתה צריך להשתמש בתחביר הנכון, בסדר הנכון.

ואם אתה חושב שזה נשמע הרבה כמו שורת פקודה, אתה לא טועה.

עוזרי קול הם פיקוד פיקוד

שורת פקודה מוגדרת באופן צר לביצוע משימות פשוטות, אבל רק אם אתה יודע את התחביר הנכון. אם אתה מחליק מן התחביר הנכון הקלד dyr במקום dir, אז את שורת הפקודה ייתן לך הודעת שגיאה. אתה יכול להשתמש כינויים קל לזכור פקודות, אבל אתה צריך מושג על מה הפקודות המקוריות היו, איך הם עובדים, וכיצד להשתמש כינויים ביעילות. אם אתה לא לוקח את הזמן כדי ללמוד את כל הפרטים של שורת הפקודה, אתה אף פעם לא תקבל הרבה מתוך זה.

עוזרי הקול אינם שונים. אתה צריך לדעת את הדרך הנכונה לומר פקודה או לשאול שאלה. ואתה צריך לדעת כיצד להגדיר קבוצות עבור Google ו- Alexa, מדוע קיבוץ המכשירים שלך הוא חיוני, וכיצד לתת שם את המכשירים החכמים שלך. אם אתה לא בצע את הצעדים הדרושים, אתה תרגיש את התסכול של מבקש הקול שלך עוזר לכבות את המחקר רק כדי להישאל, "איזה מחקר" צריך להיות כבוי.

גם כאשר אתה משתמש בתחביר הנכון בסדר הנכון, התהליך עלול להיכשל. או עם התגובה הלא נכונה שהונפקו או תוצאה מפתיעה. שני Google Homes באותו בית עשויים לתת מזג אוויר עבור מיקומים שונים במקצת, למרות שיש להם גישה לאותו פרטי חשבון משתמש וחיבור לאינטרנט.

בדוגמה לעיל, הפקודה "הגדרת טיימר למשך חצי שעה" ניתנת. מרכז הבית של Google יצר טיימר בשם "שעה" ולאחר מכן שאל כמה זמן צריך להיות. ובכל זאת לחזור על אותה פקודה שלוש פעמים אחרות עבד כראוי ויצר טיימר של 30 דקות. באמצעות הפקודה "הגדרת טיימר במשך 30 דקות" פועלת כראוי על בסיס עקבי יותר.

בעוד את הדיבור של דף הבית של Google או הד עשוי להיות יותר נוזל, תחת מכסה המנוע קול עוזרי שורות הפקודה לעבוד באותה דרך. אתה אולי לא צריך ללמוד שפה חדשה, אבל אתה צריך ללמוד ניב חדש.

ההבנה הצרה של עוזרי קול תגביל את הצמיחה

שום דבר לא מונע מעוזרים קוליים כמו Google Assistant ו- Alexa לעבוד מספיק טוב (אם כי Cortana הוא סיפור אחר). Google Assistant ו Alexa ולחפש באינטרנט באופן הוגן עבור שאלות, אם כי לא מפתיע גוגל עדיף על החיפוש, והוא יכול לענות על שאלות בסיסיות כמו המרות מדידה ו מתמטיקה פשוטה. עם להגדיר כראוי בבית חכם המשתמש מאומן היטב, פקודות הבית חכם ביותר יעבוד כמתוכנן. אבל זה בא דרך עבודה ומאמץ, לא הבנה אינטלקטואלית.

טיימרים אזעקות בעבר להיות פשטני. עם הזמן הוספת שמות, ולאחר מכן את היכולת להוסיף זמן טיימר. הם נעו מפשטניסטים למורכבים יותר. קול עוזרי יכול לענות על שאלות נוספות, וכל יום מביא מיומנויות ותכונות חדשות. אבל זה לא תוצר של צמיחה עצמית שמקורו בלמידה ובהבנה.

ואף אחד לא מספק את היכולת הטבועה להשתמש במה שידוע כדי להגיע אל הבלתי ידוע. עבור כל פקודה ושאלה זה עובד, תמיד יהיו שלושה כי לא. ללא פריצת דרך ב- A.I. המעניקה יכולת אנושית להבנה, עוזרי הקול אינם עוזרים כלל. הם פשוט פקודות פקודה קולית - שימושי בתרחיש הנכון אבל מוגבל לתרחישים אלה הם מתוכנתים כדי להבין.

במילים אחרות: מכונות לומדות דברים, אבל לא יכולות להבין אותן.