Aber wir können noch mehr erreichen. Wir können wirklich versuchen, den Ausdrucksfaktor höher zu fangen. Also, was ich hier gezeigt habe, ist, OK, angemessenerweise können wir routinemäßig nach Bildern suchen oder wir können es mit Illustrationen abwägen, auf denen unsere Wiedergabe basiert. Wenn wir also davon ausgehen, dass unsere Wiedergabe, die grundlegende, die sich in vorbegabte verwandelt hat, wir im Grunde die vorbegabte Variante genommen haben, mit der unwahrscheinlichen Wahrscheinlichkeit, dass sie sich bei Katzen in talentiert verwandelt, haben wir recht. Stellen Sie sich auf jeden Fall ein Szenario vor, in dem wir wirklich etwas wollen, für das sie nicht begabt sind. Also ist ein Fall einer Klasse, in der er nicht talentiert war, legitim? Wir wollen also wirklich Bilder von Meeren oder Booten finden; Wie sind wir bereit, diese Fähigkeit unserer Wiedergabe wirklich zu verleihen? Stellen Sie sich ein Szenario vor, in dem wir wollen, dass jeder Ausdruck verwendet wird. Für den Fall, dass die Google-Bildsuche auf 1.000 Ausdrücke beschränkt wird, wäre dies wahrscheinlich nicht sehr hilfreich. Wie können wir also Ausdrücke und Fotos wirklich integrieren?
Auch hier sind wir wieder auf unsere Ausdruckseinbettungen zurückgekommen. Daher die Regelidee, und das ist der einfachste Teil dieses Vortrags, in dem wir wirklich unsere eigene Variante unterrichten werden … aber die Hauptidee ist, dass wir diese Einbettungen verwenden werden. In diesem Sinne wurden auch diese Einbettungen vorgebildet. Die Art, wie sie vorgebildet sind, ist, dass Sie nach und nach ganz Wikipedia verschieben können, und dann die Wiedergabe lehren, angrenzende Phrasen aus einem bestimmten Ausdruck zu antizipieren, und das bietet Ihnen diese semantisch herzhaften Ausdruckseinbettungen. Anstatt also zu sagen: „Gnädig, unsere Form wird erwarten, welche Klassifizierung, dh eine Katze, ein Hund usw. ist. Außerdem hat unsere Variante am einfachsten die Daten dieser einzigartigen Klassen, ohne dass dies der Fall wäre eine Katze ist eher einem Schaf als einem Krug ähnlich”, werden wir den Ausdruck “Implantieren” angesichts der Tatsache verwenden, dass das Ziel.
Um Ihnen also zu zeigen, was diese haben, können Sie das sehen, wenn Sie nach dem Ausdruck „sagte“ suchen, in Ausdrücken dieser fortgeschrittenen Ausdruckseinbettungen, die Sie online finden können, ohne einen Cent auszugeben Noch einmal, Sie werden gesagt, gesagt, repräsentativ, erwähnt, zur Kenntnis genommen, Warnungen. In diesem Sinne schlagen Sätze, die sich in gewisser Weise in diesem semantischen Bereich befinden, ähnliches vor. Der Wunsch ist also, vorausgesetzt, wir verwenden diese Ausdrücke mit der Begründung, dass die Namen dessen, was unsere Wiedergabe vorhersagt, während unsere Anpassung Fehler begeht, es Pfusch geben wird, die überprüft werden. Noch einmal, es ist wie: “In Ordnung. Ich erfasse tatsächlich, dass dies gleichbedeutende Probleme sind, mit dem Ziel, dass Sie für die andere Option ein defektes haben sollten.”
In diesem Sinne sind dies vorbegabte Vektoren auf Wikipedia. Ich vertraue darauf, dass sie online auf der Website von Stanford erhältlich sind. Es gibt ein riesiges Problem. Diese vorgefertigten Vektoren, die wir von Wikipedia erhalten, haben also eine Länge von 300. Jeder Ausdruck ist also so etwas wie ein Vektor der Länge 300. Unsere Bildvektoren haben jedoch, falls Sie sich erinnern, eine Länge von 4.096. Auf diese Weise wird die Anwendung einer Suche nach der Alternative extrem. Darüber hinaus wurden sie in einem äußerst einzigartigen Stil begabt. Sie waren in außergewöhnlicher Weise talentiert in herausragenden Dateneinheiten, daher gibt es keinen Grund zu der Annahme, dass diese Darstellungen jetzt in irgendeiner Weise legitim sein könnten. Wir glauben also, dass wir eine gemeinsame Variante lehren müssen, um eine verwandte Darstellung zu finden.
Das ist also unsere Spezialität. So wird das wirklich durch Methode der Methode für eine Google-Veröffentlichung namens „Devise“ belebt, die eine wunderbare faszinierende Veröffentlichung ist. Die Hauptidee ist normalerweise in Faltungsgehirnsystemen, eine endgültige Schicht ist eine Vielzahl von Nullen und eine Eins und der Geschmack des Bildes. Für den Fall, dass Sie Ihren katzenartigen Geschmack als Liste 342 dargestellt haben, überspringen Sie ein Katzenbild und beleuchten außerdem Ihre Form: “In der Tat möchten Sie das Ganze auf 0 setzen und 342 zu einer Eins machen, wonach Hund vielleicht 373 ist.” oder was auch immer, wonach Ihre Variante das im Grunde tut. Es deckt im Wesentlichen die entsprechende Liste auf und löscht den Rest. Auch hier sagen Sie einfach: “OK, ich werde das mit diesem 300-Längen-Express-Vektor auffrischen.” Und Sie werden im Wesentlichen versuchen, die legitimen Kosten für jeden Koeffizienten des Expressionsvektors vorherzusagen.
Wie dies in der Praxis aussieht, ist links in unsere vorherige Form transformiert. Wir kreuzen einfach das Ende aus, das ist die Länge 1.000, und aktualisieren es dann mit etwas, das die Länge 300 hat. An diesem Punkt lehren wir dann diese Wiedergabe. Darüber hinaus werde ich Ihnen ein Stück näher bringen, das ungefähr in dieser Wiedergabe auffällt, um Ihnen ein paar Einstellungen zu bieten, nach denen Sie mir vielleicht sagen könnten, wie Sie bemerkt haben, dass es funktionieren wird. Daher trainieren wir es stattdessen auf dem 300-Term-Vektor, der mit feline verbunden ist
dieser Anordnung. Die Nachhilfe macht mit der Zeit mehr bemerkenswerte Zeit, da sie im Gegensatz zur Vorhersage aller 0 und einer 1 300 Zahlen vorhersagt, die möglicherweise nicht 0 sind, sodass die Verbesserung etwas länger dauert. Noch einmal, ImageNet ist jetzt sowieso am Anfang ein Stück schneller und verwandelt sich in eine Erinnerung an lange Nachhilfestunden auf einer GPU. Dies könnte in sieben Stunden ohne GPU für Ihren PC geschenkt werden. Die Unterrichtsdaten sind im Vergleich zu ImageNet wiederum verschwindend klein. Außerdem ist ImageNet wirklich entsprechend gekennzeichnet. Die meisten Noten scheinen in Ordnung zu sein, es gibt ein paar Fehler, aber dieser Datensatz ist – ich schlage vor, ich habe Ihnen bestätigt – ein Vorkommen, es gibt verschiedene bemerkenswertere, durchgeknallte Namen.
Alles in allem habe ich in Anbetracht dieser Art von Einstellung nicht die leiseste Ahnung, wie würden Sie feststellen, dass es funktionieren wird? Ich sehe ein paar Zustimmungen. Doch zum größten Teil sind wir im Grunde bereit zu sehen. OK, angemessen, Sie haben Glück. Ich werde Ihnen sagen, wie es funktioniert. Also, aber zuerst möchte ich wirklich ein Stück Detail wirklich bewerten. Eine Komponente, die einigermaßen sicher sein könnte und ich für aufregend halte, ist, dass wir, vorausgesetzt, wir haben diese Form begabt, eine Möglichkeit haben, von Fotos zu einem Vektor der Länge 300 zu wechseln. Und danach von Ausdrücken zu einem Vektor der Länge 300. Wir können Ausdrücke aufnehmen und nach Fotos suchen, aber wir fotografieren außerdem und suchen nach Phrasen. Auch das geht zurück zu unserem Etikettierungssystem. Also, ohne aller Wahrscheinlichkeit nach schwierig, hier ist die Art und Weise, wie diese Bezeichnungswiedergabe funktioniert. Ich passe ein Bild an und erwähnte es im Grunde, was sind die zehn extremsten ähnlichen Ausdrücke aus der Perspektive dieses Bildes? Außerdem können Sie jedes der Probleme sehen, die es erstellt. Ich vertraue also darauf, dass die Politur dieses Bildes möglich ist. So können Sie sehen, dass eine Gruppe von Variablen erzeugt wird, die wirklich ein Geschenk innerhalb des Bildes sind. Es hat ein paar Daten dieses Bildes.
Wie wäre es jedoch, wenn wir zum Beispiel zu unserem Look zurückkehren würden. Eines der Beispiele in unserem Datensatz ist also der Hund. In diesem Sinne, wenn wir nach Eckzähnen suchen, bekommen wir Eckzähne, das ist sehr richtig. Aber unsere totale Begründung, legitim, die totale Motivation hinter dieser Variante verwandelte sich in, würden wir sagen, dass wir bereit sind, nach einer Klasse zu suchen, die sich jetzt nicht in unserem Nachhilfedatensatz befindet? Wenn Sie also nach Meer suchen, das keine Klassifizierung innerhalb des speziellen Datensatzes ist, den unsere erste Variante in „begabt“ umgewandelt hat, oder in diesem neuen kleinen Datensatz, den wir verwendet haben, erhalten wir einige sehr gute Ergebnisse . Darüber hinaus können Sie sehen, welche Fehler Sie erhalten, die legitim erscheinen. Ich schätze, die Mitte am legitimen kann eine Wasserstraße sein. Auf jeden Fall ist ein Wasserrand etwas, das einem Meer semantisch nahe steht. Wir können im Grunde auf die gleiche Weise vorgehen … meine Güte, wirklich, ich möchte wirklich darauf zurückkommen. Eine aufregende Komponente ist, dass eine Klasse dieses neuen Datensatzes Boot ist. Sie können also behaupten, dass wir zweifellos festgestellt haben, dass das Meer dem Boot ähnlich ist, also werden wir jedes der Beispiele, die dem Boot ähnlich sind, zurückgeben.
So können wir verschiedene Probleme angehen. Wir können Straße versuchen. Außerdem bringen wir hier Fotos von vielen Illustrationen zurück; Fahrzeug, Hund, Fahrrad, Transport, Charakter gehören zu den zurückgegebenen Beispielen. Darüber hinaus enthält die Grenze von ihnen wirklich eine Straße. Das ist also sehr faszinierend. Wir haben wirklich eine Version in 100. 100. der Zeit geschenkt, die es braucht, um gängige tiefgreifende Kennenlernmodelle zu unterrichten, und wir haben einen erstklassigen Look für Motor. Angenommen, wir wollten es prominenter an unseren speziellen Datensatz anpassen oder andererseits annehmen, dass wir gesehen haben, dass es sich in Fehler verwandelt hat, haben wir eine Möglichkeit, auf jeden Fall bemerkenswertere Daten zu erhalten, die Vortalentierten Expressionsvektoren und beauftragen unsere Variante mit diesen zusätzlichen Daten. Gleichzeitig werden aber noch einmal Bestellungen von erheblichem Wert wesentlich weniger Daten benötigen, als Sie normalerweise benötigen.
Was zweifellos faszinierend ist, ist, dass Zustandsvektoren so verzaubert sind, dass Sie, wenn Sie die Normalität von Ausdrucksvektoren erhalten, dieser Methode für diese Kombination von Ausdrücken sehr nahe kommen. Dies beginnt mit der Trennung, wenn Sie außergewöhnlich lange Strafen haben. Für bestimmte Ausdrücke funktioniert es jedoch wirklich ziemlich angemessen. Wenn wir also nach einer Katze auf einer Couch suchen, so das wesentliche Beispiel zu Beginn dieses Vortrags, haben wir eine laute Gruppe von Kreaturen auf Sofas und ich denke, eine Katze auf einem Tisch. Es gibt auch noch einmal, dass ich es liebe, die Fehltritte zu durchschauen, die diese Wiedergabe macht. Wenn Sie also in der Mitte links erscheinen, haben Sie eine Couch, ein Bild von etwas, das aussieht, als ob es vielleicht ein paar w füllen würde
womit man ein Pad einführen könnte. Auf jeden Fall sieht das im Grunde genauso aus wie Pelz, was ich finde, gnädig, das scheint in Ordnung zu sein. Als hätte die Form eine laute Fellgruppe bekommen, verwandelte sie sich in „Gnädig, das ist eine Katze“. Und danach gibt es eine Couch. Dort überqueren Sie.
Für den Fall, dass Sie noch mehr sehen möchten, befindet sich das Archiv auf GitHub. Ich werde eine andere Gelegenheit nennen, um Ihnen zu zeigen, dass diese 2D-Komponente wirklich glatt ist. Auf diese Weise, hier, während wir wieder zu Phrasen übergehen, sind das Vektoren der Länge 300. Und danach entwickeln wir eine Aufzeichnung. Darüber hinaus erstellen wir im Grunde eine Ausdrucksliste innerhalb der genauen, nicht zu unterscheidenden Art und Weise, wie wir für Fotos fertig sind. Wir können also nach einer Reihe von Elementen suchen; Sie können nach Gehäusen suchen, und es bietet Ihnen die optionalen Klammern. Was mehr ist, t