Car-tech

Windows Phone 7 ל- Excel על דיבור

?איך לדבר במקום להקליד | Talktyper voice to text ?

?איך לדבר במקום להקליד | Talktyper voice to text ?
Anonim

מקווה לקפוץ מעל גוגל ואת ההצלחות של אפל בשוק הטלפונים החכמים, מיקרוסופט מתכננת להשתמש בעובדי דיבור מבוססי ענן ובטכנולוגיית עיבוד שפה טבעית כדי להציע יכולות ממשק משתמש שאינן נמצאות במכשירי iPhone או Android.

"אנו מאמינים שהדיבור אינו יישום נפרד. הוא מהווה חלק בלתי נפרד מחוויית המשתמש ", אמר זיג סרפין, מנהל התקשורת המאוחדת של מיקרוסופט, לפני קהל בכנס SpeechTEK 2010, שנערך השבוע בניו יורק.

כדי לשפר את יכולות Windows Phone 7 עבור הבנה של פקודה קולית ומספקת את התוצאה המבוקשת, החברה מתכננת לקשור טלפונים Windows Phone 7 עם זיהוי ענן מבוסס Tellme החברה מבוסס קול שפה שירות עיבוד שפה טבעית, אמר Se ראפין, בראיון נוסף עם שירות חדשות IDG.

[לקריאה נוספת: מיטב מכשירי אנדרואיד לכל תקציב. [

] מיקרוסופט רכשה את החברה שיצרה את השירות הזה, טלם נטוורקס, בשנת 2007.

לפני קהל SpeechTEK, סראפין נזף במערכות ההפעלה אנדרואיד ו- iPhone לשימוש בסמלים כצורה העיקרית של אינטראקציה. "רוב הסמארטפונים הם רשת של סמלים, בדומה ל- Windows 3.1", אמר. "לדבר בטלפון הוא דרך טבעית יותר להגיד את זה מה לעשות, הוא אמר. "כאשר אתה עובר למכשיר שאין לו מקלדת גדולה, הקול הוא משלים משכנע כל כך לחוויה הזו", אמר סראפין.

אז הוא היה מנהל השיווק של מיקרוסופט איליה Bukshteyn לרוץ באמצעות הדגמה של איך טלפון של Windows 7 יכול להשתמש בזיהוי דיבור ועיבוד שפה טבעית, או באמצעים שבהם מחשב מפרש את מה שאדם אומר. בוקשטיין ביקש מהטלפון שייקרא "פול", וקול שפלט מהמכשיר הגיב עם מספר קשרים שונים עם שמו הפרטי של פול. בוקשטיין הגיב עם השם המלא, והטלפון המשיך להתקשר לאותו אדם.

Bukshteyn גם אמר לטלפון לפתוח אלבום תמונות, ואפליקציית תצוגת תמונות עלתה על המסך, המציגה לא רק תמונות שצולמו על ידי המשתמש, אבל גם נלקח על ידי החברים של המשתמש אשר פורסמו באתרי הרשתות החברתיות.

בדוגמה שלישית, Bukshteyn ביקש רשימה של מסעדות סיניות בקרבת מקום. הבקשה הועברה לשירות החיפוש של בינג, אשר החזיר רשימה של מסעדות ומיקומן על גבי מפה.

בעוד שה- iPhone וה- Android משתמשי בכמה יכולות זיהוי קולי, שירות הטלפון של Microsoft יהיה שונה במספר כבוד, אמר סראפין. ראשית, זה לא יהיה מוגבל לשימוש רק כמה Apps, אלא יכול לשמש כדי לשלוט על הטלפון כולו. הדרך השנייה שבה שירות זה יהיה ייחודי היא שזה יהיה אינטראקטיבי. אם ניתנת פקודה מעורפלת, המכשיר או השירות המתאים יכולים לבקש מהמשתמש להבהיר את הבקשה.

רכיב הדיבור הוא חלק אחד ממה ש Serafin כינה "ממשק המשתמש הטבעי" או NUI. ה- NUI נשען על קול, מגע ואפילו תנועה כצורות קלט. "דיבור הוא הליבה של NUI", אמר. חלק מההפגנה הראה כיצד טכנולוגיית Kinnect XBox של מיקרוסופט יכולה לפרש מחוות ידיים כדי להפעיל פעולות במחשב. טכנולוגיה זו תשתמש במוצרי מיקרוסופט מעבר ל- XBox, אמר Bukshteyn בראיון שנערך ל- IDG.

Serafin אמר כי החברה נמצאת בתהליכים המוקדמים של אינטראקציית דיבור מתגלגל לתוך רכיבים שונים של Windows Phone 7, - חיפוש, חיוג אנשים, והדרכת משתמשים לאוספי תמונות.

משתמש יכול להפעיל את הטלפון כדי להאזין לפקודות קוליות על ידי לחיצה על לחצן אחד בטלפון. חלק עיבוד השפה ייעשה בטלפון וחלקם ייעשה על ידי Tellme. "בכנות, המשתמש לא צריך לדעת או לדאוג" שבו פקודות קוליות מעובדות, אמר Bukshteyn.

Serafin טען כי שירות Tellme הוא הגדול ביותר בשימוש בדיבור מבוסס שפה טבעית מערכת עיבוד בשימוש היום. מיקרוסופט מעבירה את השירות לארגונים גדולים לקבלת תמיכה טלפונית מבוססת התמיכה הטלפונית. לדבריו, שירותיו של ג'ואב ג'קסון מתפרסמים על פני 2.5 מיליארד דולר בשנה. בצע יואב בטוויטר ב @ Joab_Jackson. כתובת הדואר האלקטרוני של יואב היא [email protected]