Die humane KI-Anstecknadel wurde von der Kritik verrissen, aber sie enthält einige coole Ideen
Zusammenfassung
- Zukünftige Universalübersetzer könnten lokale Sprachmodelle für eine schnellere und effizientere Übersetzung verwenden.
- KI-gestützte digitale Assistenten, die Smartphones über Sprachbefehle steuern, könnten das nächste große Ding sein.
- Datenschutzfunktionen wie die standardmäßig in jeder Chat-App aktivierte Ende-zu-Ende-Verschlüsselung und visuelle Hinweise für die Aufzeichnung sollten auf Smartphones Standard sein.
Der KI-Pin von Humane wurde zu einem der schlechtesten Tech-Produkte des Jahres 2024. Trotz des kritischen Schwenks, den das Gerät zu Recht verdient hat, birgt der AI Pin einige ziemlich coole Ideen. Ich kann mir vorstellen, dass drei dieser Ideen ihren Weg in Smartphones finden oder als eigenständige Geräte Realität werden.
Ich kann die Zukunft sehen, in der erschwingliche Universalübersetzer eine Sache sind
Eine der coolsten Funktionen des Humane AI Pin ist seine Echtzeit-Übersetzung, insbesondere in Kombination mit dem Formfaktor und der Tatsache, dass sich das Gerät auf Ihrer Brust befindet, wo es nahtlos aufnehmen kann, was Sie und die Person, mit der Sie sprechen, sagen.
Abgesehen von der Tatsache, dass niemand, der bei klarem Verstand ist, 700 US-Dollar für einen Echtzeit-Hardware-Übersetzer bezahlen sollte, besteht das Problem darin, dass die Funktion, wie praktisch jede Funktion, die auf dem KI-Pin zu finden ist, nicht immer wie beabsichtigt funktioniert, und wenn sie es tut, ist sie ziemlich langsam.
Trotzdem kann ich mir eine Zukunft vorstellen, in der wir erschwingliche Universalübersetzer einsetzen. Anstatt jedoch ein Cloud-basiertes großes Sprachmodell auszuführen, würde dieser universelle Übersetzer ein lokales LLM ausführen, das sich auf Sprachübersetzungen und nichts anderes spezialisiert hat. Alles, was Sie tun müssen, ist, die Ausgabesprache einzustellen – oder der Übersetzer erkennt automatisch die Sprache, die Ihr Gesprächspartner spricht.
Auf diese Weise könnte die Übersetzung viel schneller ablaufen, und der Übersetzer wäre nicht mit modernster Hardware ausgestattet. nur ein System-on-a-Chip (SoC), das leistungsfähig genug ist, um ein lokales Modell auszuführen, das auf Übersetzung spezialisiert ist, zusammen mit rudimentärer Firmware. Es wäre kein vollwertiges Betriebssystem erforderlich. Mit der Ankunft von GPT-4o klingt das nicht mehr wie ein weit hergeholter Traum. Darüber hinaus sehen wir den Aufstieg von NPUs (Neural Processing Units), die KI-Modelle in Zukunft effizienter ausführen werden.
Ein solches Gerät könnte bei großen internationalen Konferenzen eingesetzt werden, bei denen nicht jeder Teilnehmer perfekt Englisch spricht, bei Auslandsstaatsbesuchen, bei der UNO und ähnlichen Organisationen, bei denen die Mitglieder nicht die gleiche Sprache sprechen, wie z.B. dem Europäischen Rat. Definitiv besser als die Verwendung von menschlichen Übersetzern oder Ihrem Telefon.
Ein weiterer Anwendungsfall könnte bei touristischen Sightseeing-Touren sein, bei denen Universalübersetzer die Kommunikation zwischen Touristen und Einheimischen sofort ermöglichen könnten, ohne sich auf andere Tools wie Smartphones, Wörterbücher verlassen zu müssen oder zu beten, dass Sie jemanden in Ihrer Gruppe haben, der die Landessprache spricht – was in einem englischsprachigen Land ziemlich üblich ist, in Ländern, in denen Englisch nicht eine der Amtssprachen ist, nicht so üblich.
Ein KI-basierter digitaler Assistent könnte eine reine Sprachinteraktion am Telefon ermöglichen
Das Versprechen von Humane, einen KI-basierten digitalen Assistenten zu entwickeln, ist gescheitert, aber die allgemeine Idee eines KI-gestützten digitalen Assistenten klingt durchaus verlockend. Stellen Sie sich vor, Sie hätten einen digitalen Assistenten, der nicht nur in der Lage ist, eingeschränkt mit dem Betriebssystem Ihres Telefons zu interagieren, auf eingehende Nachrichten zu antworten und Google-Abfragen durchzuführen, sondern auch mit jeder einzelnen App auf Ihrem Telefon zu interagieren. Sie können diesen Assistenten dann verwenden, um Ihr Telefon nur über Sprachbefehle zu steuern.
Abgesehen von Datenschutzproblemen und aktuellen Problemen, die Google und die Bande mit LLMs haben, könnte dies das Killer-LLM-Feature sein. Ein digitaler Assistent, der immer da ist und Ihre E-Mails und Nachrichten schreiben, Musik auf Spotify abspielen, zufällige Notizen schreiben, Ihnen das aktuelle Wetter mitteilen, Essen über Ihre Lieblings-App bestellen und vieles mehr.
Ich habe dies ausführlich in meinem Artikel über die Datenbrille diskutiert, in dem ich auch erwähnt habe, dass Ihr regulärer Alleskönner LLM hier nicht ausreichen wird. Ein multimodales Grundlagenmodell, das auf die Verwendung von Smartphone-Apps trainiert wurde und mit dem wichtigsten KI-Assistenten – Gemini oder KI-gestützter Siri – zusammenarbeitet, da seine Unterroutine auf Ihrem Telefon gespeichert ist, wäre wahrscheinlich eine bessere Option als ein vollwertiges LLM, das ein Array von GPUs benötigt, um auf einer konstanten Internetverbindung zu funktionieren. was bei dem "Assistenten" der Fall ist, der im Humane AI Pin zu finden ist.
Google versucht so etwas mit seinem Project Astra zu tun und bestätigt damit, dass Humane mit seinem KI-Digitalassistenten die richtige Idee hatte. Leider war es wahrscheinlich die falsche Strategie, das Projekt durch die Tür zu peitschen, bevor Google und Apple ihre KI-gestützten digitalen Assistenten anboten.
Außerdem klingt ein Smartphone in Kombination mit einer Smartwatch oder einer Datenbrille nach einer viel besseren Kombination für die Verwendung und Ausgabe von Befehlen an einen vielseitigen KI-Assistenten als ein Gadget ohne Display, das eine ständige Internetverbindung benötigt und eine angeblich erbärmliche Akkulaufzeit hat.
Ich würde gerne die Datenschutzfunktionen von Humane AI Pin auf Smartphones sehen
Lassen Sie uns zu guter Letzt über die datenschutzbezogenen Funktionen von AI Pin sprechen, wahrscheinlich der einzige Aspekt des Geräts, den ich wirklich mag. Zunächst einmal sollte jede einzelne Chat-App mit einer standardmäßig aktivierten Ende-zu-Ende-Verschlüsselung ausgestattet sein. Dies ist eine grundlegende Datenschutzfunktion und leider bieten viele Chat-Apps sie nicht an. Selbst wenn dies der Fall ist, ist die Ende-zu-Ende-Verschlüsselung in den meisten Fällen nicht standardmäßig aktiviert.
Als nächstes ist ein visueller Hinweis, der jedes Mal aufleuchtet, wenn Sie mit dem AI Pin filmen oder Fotos machen, eine brillante Funktion, die ich gerne auf Smartphones sehen würde. Fügen Sie einfach einen RGB-Lichtstreifen um das Kameraobjektiv herum hinzu – oder an einer beliebigen Stelle auf der Rückseite des Geräts, da das Licht um das Kameraobjektiv herum die Bild- und Videoqualität beeinträchtigen kann – und jedes Mal, wenn Sie mit dem Filmen oder Fotografieren beginnen, leuchtet der RGB-Ring auf und benachrichtigt andere Personen, dass Sie sie aufnehmen.
Ich glaube nicht, dass der Humane AI Pin, der Rabbit R1 oder ein anderes "AI Pin"-Gerät jemals zum Mainstream werden werden. Dennoch denke ich, dass die drei Ideen, für die sich der KI-Pin einsetzt, über den ich in diesem Artikel gesprochen habe, ihren Weg auf den Markt finden, viel Aufmerksamkeit erregen und zum Mainstream werden können, insbesondere der allmächtige digitale KI-Assistent.