Dave Isbitski von Amazon: Voice Tech kennt keine Generationsgrenzen

Im Jahr 2016 habe ich meine erste Präsentation bei Amazon Alexa und Echo gemacht, und zu der Zeit standen ungefähr 700 Fähigkeiten zur Verfügung. Heute gibt es über 100.000. Und Hunderte Millionen von Alexa-fähigen Geräten. Da die meisten von uns mehr Zeit in unseren Häusern verbringen, wollte ich mit Dave Isbitski, dem Chef-Evangelisten von Amazon für Alexa und Echo, wieder aufholen.

In einem ziemlich umfangreichen Chat, den wir in LinkedIn Live kürzlich geführt haben Die Sprachtechnologie vereint Generationen und wie er sieht, wie die Stimme eine wichtige Rolle in der PC (Post Covid)-Ara spielt.

Unten finden Sie ein bearbeitete Transkript eines Teils unseres Gesprächs. Um die vollständige Convo zu hören, klicken Sie auf den eingebetteten Soundcloud-Spieler.

Kleinunternehmenstrends: Wie weit sind die Dinge mit Alexa-und Echo-Geräten gekommen?

Dave Isbitski: Wenn ich 2014 sagen würde, wer hat ein Echo? Ich musste erklären, was das überhaupt war. Jetzt im Jahr 2020 wissen die meisten Menschen, was Echo ist. Ich meine, es gibt sogar den Live-Sketch am Samstagabend. Sie bekommen, was Alexa ist. Sie haben wahrscheinlich mehrere Geräte. Sie sind nur intelligente Assistenten und KI auf ganzer Linie. Das hat sich als Teil der Umgangssprache wirklich verändert. Es ist Teil der täglichen Routinen der Menschen.

Was die Leute vielleicht wissen oder nicht, ist, dass Sie diese AIS unterrichten können. Es ist also einfach keine Alexa, es ist einer dieser intelligenten Assistenten. Was wir bei Amazon tun, ist, dass wir das kostenlos, offen und für alle verfügbar machen. Egal, ob sie Alexa in Dingen haben wollen, damit das Automobile sein könnte, es könnte sich um Auto-Stereos handeln, es könnte Ihr Telefon sein. Windows hat Alexa jetzt eingebaut, oder Sie möchten Alexa beibringen, wie man Gespräche über Dinge führt.

Und wenn Sie ein Gespräch über etwas führen, nennen wir das eine Fähigkeit. Sie bringen Alexa also eine neue Fähigkeit bei und können sich über alles unterhalten. Und das könnte es sein, als würde man gerade den Ihrer Domino bestellen, oder? Wenn wir zu Hause in einer Pandemie sitzen, liefern sie. Sie könnten eine einfache Bestellung machen oder es könnte nur Spiele hochziehen. Geh einfach nach Amazon wenn die Leute neugierig sind, weil ich von Leuten höre, die sind: “Hey, meine Kinder machen mich verrückt. Gibt es Spiele?” Es gibt absolut Spiele. Gehen Sie zu Amazon.com/skills. Sie werden dort oben Kategorien sehen, Brent, die wir vor einiger Zeit nicht hatten. Sie sehen also alle diese Kategorien, genau wie jedes andere Amazon-Produkt können Sie sagen, dass Sie mir sagen können, dass Sie mir vier Sterne und über den Bewertungen zeigen. Einige davon haben jetzt Zehntausende und Zehntausende von Bewertungen.

Eines der Dinge, die Sie jetzt als Amazon-Kunde tun können, ist, dass Sie auf Blueprints.amazon.com gehen können und diese Dinge visuell erstellen können. Ich höre von den Eltern, dass ihre Kinder ihre eigenen Geschichten schaffen.

Kleinunternehmenstrends: Ja.

Dave Isbitski: Vielleicht kümmern Sie sich um jemanden, der zu Hause ist. Sie möchten sie daran erinnern, Dinge zu tun. Sie möchten ihnen die Fähigkeit erstellen, Fragen zu stellen. Wie bei welchen Medikamenten nehme ich? Wann nehme ich es? Alle, die Sie tun können, und dann können Sie es ihrem Amazon-Konto zuweisen.

Ich habe das für meine Eltern getan, wo ich Dinge eingerichtet habe. Das ist etwas, in dem wir versucht haben, den Prozess so nahtlos wie möglich zu erstellen, damit Sie Alexa beibringen können, Gespräche führen zu können, um Inhalte zu erstellen, die Sie möchten, unabhängig davon, ob Sie Code schreiben können oder nicht.

Kleinunternehmenstrends: Sehen Sie viele Verhaltensänderungen und Leute, die ihre Lautsprecher nutzen, um Dinge zu tun, die sie vorher nicht wirklich getan haben?

Dave Isbitski: Nun, eines der Dinge, die ich höre, und Sie werden dies online sehen. Sie sehen vielleicht sogar, dass dies in Ihren Facebook-Feeds und Twitter ist, dass es so wichtig ist, sich während aller zu verbinden diese. Wir haben tatsächlich wir versuchen es einmal pro Woche, uns über Video mit meinen Eltern zu verbinden, nur um zu sehen. Und eines der Dinge, die wir konsequent hören wenn Sie hierher gehen. Das bringt Sie zu einem Blog-Beitrag um Alexa und Geräte und was ist los. Sie werden hören, wie wir über einige davon sprechen.

Ich glaube nicht , schauen Sie auf Großeltern ein. ” Oder “Alexa kommt auf Mutter vorbei.” Oder “Alexa kommt bei Kindern vorbei.” Und es ist unglaublich, wie nahtlos das wird. Und vor allem während dieser Pandemie ist die Fähigkeit, einfach so zu kommunizieren, ohne ein Telefon zu benötigen, ohne Apps zu aktualisieren, oder? Dies ist eine Erfahrung. Es ist nur da. Und die Stimme ist nahtlos. Es ist inklusiv. Jeder kann es schaffen. Stimme ist die erste Technologie, die meine Eltern genauso aufgeregt sind wie meine Kinder, oder? Und mein Vater benutzt immer noch keinen Computer, aber er kann die Dinge auf

Kleine Unternehmenstrends aufziehen: Wirklich?

Dave Isbitski: Ja, ich weiß, dass es verrückt ist, oder? Sowohl mein Bruder als auch ich sind Technik, meine Mutter druckt E-Mails für ihn aus. Er meldete sich nie an ja. Aber ich habe darüber gesprochen, wo wir diese Geräte in den Krankenhäusern gespendet haben, und die Leute haben die Möglichkeit, zu irgendeiner Zeit durch zu sprechen und sich zu verbinden, oder? Weil Sie es auch nicht berühren, was eine wichtige Sache ist. Wir haben ihnen Krankenhäusern gegeben, in denen Krankenschwestern die Möglichkeit haben, einzuchecken und darüber zu sprechen, alles komplett freihändig.

Ich habe gerade mit den Leuten bei Johns Hopkins gesprochen. Und ich werde seinen Namen nicht erwähnen. Er ist ein Chirurg in New York. Und es war sehr herzerwärmend. Er sagte nur: “Ich möchte mich nur bei Ihnen bedanken. Vor zwei Jahren hatte meine Mutter, sie hatte Demenz und Alzheimer und wir haben Alexa die ganze Zeit verwendet. Sie hatte die Fähigkeit, um Hilfe zu rufen. Sie hatte die Fähigkeit, uns bei jedem anzurufen Zeit. Und so konnten wir mit ihr kommunizieren.

Also ein paar Dinge, die wir hinzugefügt haben. Eines der Themen ist das Feedback von Kunden, Alexa persönlicher zu machen. Zum Beispiel können Sie jederzeit jederzeit sagen, dass Alexa sich an Dinge erinnern soll, was ich als erstes an das Wi-Fi-Passwort erinnerte, oder? Und wenn wir Gäste haben, können sie sagen: “Was ist das WLAN-Passwort?” Recht. Und sie kann es Ihnen sagen, oder es könnten Dinge sein, die meine Eltern an Dates und Geburtstage und ähnliche Dinge erinnern können.

Wir haben alle unterschiedliche Persönlichkeiten. Wenn Sie sich Myers-Briggs ansehen, wenn Sie sich NBTI und fünf Kernpersönlichkeitstypen ansehen, wie ich in INFJ bin. Ich weiß nicht, ob Sie mit diesen Typen vertraut sind. Oft kann ich nicht aus meinem eigenen Kopf herauskommen, aber ich kann mehrere Ideen in meinem Kopf jonglieren. Ich kann in kognitiven Dissonanzen leben. Andere Leute sind nicht so. Und Mobile und Web sind eine Größe für alle. Es ist wie, hier ist unser Design. Und wenn es dir nicht schwer gefällt und dann unser Gehirn trainieren, oder? Wir bauen diese neuronalen Wege auf und wie man eine Schnittstelle benutzt. Und wenn Sie diese Schnittstelle ändern, ist es für Menschen erstaunlich. Wenn eine dieser Social-Media-Sites die Art und Weise verändert, wie ihr Feed jeden Tag aussieht.

Kleinunternehmenstrends: Richtig.

Dave Isbitski: Was an der Stimme großartig ist, ist die Art und Weise, wie Sie das konsumieren möchten. Sie können entscheiden, welche Art von Person Sie hören möchten. Tatsächlich haben wir einen Service namens Polly Brand und erstellt Stimmen. KFC, wir haben mit ihnen gearbeitet und Sie können die Stimme des Obersten bekommen. Dies ist mein absoluter Favorit, der heute richtig ist, mit dem Alexa-Gerät können Sie sagen: “Ach sam.” Also Samuel L. Jackson, und er wird dir Wetter und Witze sagen. Und all das verwendet eine Technologie namens Neural TTS (Text to Sprache), oder?

Es gab einen Durchbruch mit neuronalen Netzen, um den Ton zu reproduzieren. Wenn Sie nun durch neuronale TTs einen Computer verwenden und es sich ansehen, dass es computergeneriert ist, aber für das menschliche Ohr, klingt es wie ein menschliches Wesen und Sie können die Entdeckung ändern. Sie können es aufgeregt machen. Wir haben das mit Alexa gemacht, wo Sie, wenn Sie diese Erfahrungen erstellen, ich meine, wie die Stimme klingt. Sie können sie aufgeregt machen. Wir haben das Ding für Kunden hinzugefügt, wo wir hören, wie wir kleine haben, und ich spiele ein Schlaflied oder ich schaltete die Lichter nachts aus, oder? Weil viele Leute Alexa mit Smart Home verwenden, werden sie sagen: “Schalten Sie das Licht aus.” Und sie ist super laut und weckt das Baby, oder? Wie niemals das Baby wecken.

Sie können Alexa also flüstern und dann wird sie sagen: “Oh, es hört sich so an, als ob du flüsterst. Möchten Sie, dass ich zurückweist?” Und Sie sagen: “Ja, es ist Whisper-Modus.” Und so werden Sie sagen: “Schalten Sie das Licht aus.” Und sie wird sagen: “Okay, ich werde das Licht ausschalten.” Recht? Aber es ist sehr menschlich. Ein weiterer Bereich, den Sie sagen können, ist: “Sie wissen was, rede schneller, rede langsamer, langsamer.” Und so wird sie die Dinge langsamer sagen, oder sie wird die Dinge schneller sagen.

Wir haben die Fähigkeit, Ton zu erkennen, oder? Es ist also ganz anders. Wenn ich sage: “Alexa, halt die Klappe.” Versus: “Alexa, danke. Hör auf.” Und wir haben alle möglichen Dinge. Als hätten wir immer die Fähigkeit gehabt Ich denke, wir haben in Ihrer letzten Show darüber gesprochen. Seit dem ersten Tag hatten Sie seit unserer Start die Möglichkeit, alles zu löschen, was Sie jemals zu Alexa gesagt haben. Sie hatten die Fähigkeit, die Dinge zu sehen. Und wenn Sie sich nicht mit Technologie befassen wollten, können Sie Amazon einfach anrufen und es tun. Aber die Leute wollten die Fähigkeit im laufenden Flug hören und haben. Also haben wir das geöffnet und Sie können Dinge wie “Alexa, löschen, was Sie gerade gehört haben.” Sie könnten sagen: “Alexa, was hast du gerade gehört?” Und dann wird sie es wieder wiederholen. Man könnte sagen: “Alexa, löschen Sie alles, was Sie heute gehört haben.

Und es ist interessant. Sie können sogar Dinge sagen wie: “Alexa, warum hast du das getan?” Und sie wird sagen: “Nun, das habe ich gehört und deshalb habe ich das getan.” Und so ist es sehr ermächtigend, weil es den Menschen hilft, zu verstehen, denn selbst als Menschen werde ich eine Sache sagen, aber es ist nicht unbedingt das, was Sie auf die gleiche Weise gehört oder verarbeitet haben, oder? Und so gibt sie den Leuten diese Fähigkeit, sie sagen: “Oh, sie hört immer wieder dieses Wort. Oder ich sage so.” Es ist sehr ermächtigend in einer offenen Einrichtung.

Einige der anderen Dinge sind zweisprachig. So können Sie in den USA im laufenden und hinter den Kulissen zwischen Englisch und Spanisch wechseln, und setzen es in ein Lexikon. Und so dass beide Sprachmodelle funktionieren und Sie in Kanada in Kanada, in Kanada, in Indien in Kanada wechseln können. Denn so sprechen wir als Menschen. Wenn Sie in einer zweisprachigen Familie aufgewachsen sind, bewegen Sie sich einfach zwischen Wörtern und Sprachen hin und her, und das kann sie dazu in der Lage sein.

Und so sind es diese Art von Dingen, weil nichts schneller ist, als nur danach fragen zu können. Und dort würde ich dort sagen, wir entwickeln uns wie heute weiter, dort sind wir und wir können über zukünftiges Aussehen sprechen.

Kleinunternehmenstrends: Sehen Sie einige der Interaktionen, die normalerweise mit Ihrem Telefon mit Ihren Sprachgeräten stattgefunden hätten?

Dave Isbitski: Nun, ich schaue es so. Die Mission unserer Gruppe war schon immer Alexa überall, wo Sie es haben möchten. Und im Moment ist das im Haus. Aber wenn Sie eine Fahrt machen, sollten Sie in der Lage sein zu sagen: “Alexa, lesen Sie mein Buch.” Und es war das Audiobuch, vielleicht haben Sie sich gerade in Ihrer Höhle angehört, oder? Es ist nur nahtlos. Ich wurde schon einmal zitiert und ich denke, es ist immer noch die beste Analogie, ist, dass die Stimme das neue HTML ist.

Denken Sie also darüber nach, wann das Web zum ersten Mal herauskam und das Internet zum ersten Mal herauskam. Wie haben Sie Unternehmen kontaktiert? Recht? Es war, als hätten Sie einen Brief geschrieben, Sie gingen in ihre Lobby oder einen Anruf. Und plötzlich durch HTML, oder? Und ich wollte nicht sagen, dass Voice das neue Web ist, denn Web ist so sozial und alles auch. Weil es die Schnittstelle ist. Also wurde HTML plötzlich die Schnittstelle, die sich mit irgendjemandem, überall auf der Welt, einer Marke auf der Welt in Verbindung setzen konnte, oder? Fragen zu irgendetwas stellen. Es war wirklich so, wie HTML das Web zusammenbrachte. Und so sollten Sie die Stimme betrachten. Es ist das HTML für alles.

Dies ist Teil der Einzelinterviewserie mit Vordenker. Das Transkript wurde zur Veröffentlichung bearbeitet. Wenn es sich um ein Audio-oder Video-Interview handelt, klicken Sie oben auf den eingebetteten Player oder abonnieren Sie iTunes oder über Stitcher.

Similar Articles

Most Popular