So funktioniert die Dropbox-Bildsuche

Wenn Sie ein Foto suchen müssen, das vor einigen Jahren bei einem Picknick aufgenommen wurde, können Sie sich kaum an den Namen erinnern, den die Kamera der Datei zum Zeitpunkt der Aufnahme automatisch zugewiesen hat, z. B. 2017-07-04 12.37.54.jpg . Sie sehen alles durch - Fotos, ihre Skizzen, versuchen Objekte oder Zeichen dessen zu identifizieren, wonach Sie suchen - und es spielt keine Rolle, ob Sie nach einem verlorenen Foto suchen oder ein anständiges Foto in den Archiven für die Präsentation von suchen möchten ein neues Projekt.





Es wäre großartig, wenn Dropbox alle Bilder unabhängig voneinander anzeigen und diejenigen auswählen könnte, die am besten zu den Wörtern in der Beschreibung passen! Dies ist genau die Aufgabe, die wir uns beim Erstellen der Bildsuchfunktion gestellt haben .





, Dropbox , , , , Dropbox .






Bildsuchergebnisse nach Stichwort "Picknick"
""

, , , Dropbox.





: , () q j, s , , :





s = f(q, j).





- , , . : .





, . , . 





:





  • , , ;





  • , , ;





  • , , - .





— 2012 . Krizhevsky . ImageNet hallenge. , , , , Open Images ImageNet, , TensorFlow PyTorch, , . , :





Ergebnisse der Anwendung eines Bildklassifikators auf eine typische nicht inszenierte Fotografie

, , . , , , , , ? , ?





, , , .





. jc . C- , C — ( ). , , , .





— . — word2vec — Mikolov . 2013 . Word2vec , , , , . d- , d .





, word2vec. , , :





  1. q d- qw, . w, — c.





  2. ciw. m̂i = qw - ciwi- . -1 1 , . ( mi = max(0, i)), , .





  3. , qc = [m1 m2 ... mC], C- , , — , , .





3 — - , qc = qwC, Cciw.





qcs = qcjc.





. . - , s = qcJ, J jc , s — .





. , — : , , .





, . , [0,35–0,62 0,70], .





, .





Projektion des Vektors von Abfragewörtern auf den Kategorieraum

  EfficientNet, OpenImages. 8 500 . , . , Dropbox.





TensorFlow   ConceptNet Numberbatch. , , , , . : dog chien , .





AND, . , , beach ball, . , OR , beach ball (beach AND ball) OR (beach ball). , .





, , J . , , , , . ().





J , Dropbox Nautilus.





, Nautilus (forward index), (, ) , (inverted index), (posting list) , . :





Inhalt des Suchindex für die Textsuche

, doc_1 doc_2 , . doc_3 , , . 





, , . doc_1 , doc_2, doc_1 .





. jc . .





Inhaltssuchindex zum Suchen von Bildern nach Inhalten

, :





  1. qw C qc, . C — , , .





  2. , qc, . , , .





  3. jc qc, s. , .





- , . 10 000 10 000 , 40 . , 10 000 . , 40 80 . , , !





, , , , m̂i , 5 000 . , 10 .





, , , . s = qcjc, qc — 10 000 , jc — 10 000 , . , s





qc jc , . , 10 qc 50 jc . :





  • 10 000- 50 , 50 . ; 50 ( ) 50 ( ) 300 .





  • 10 000, 50 , 200 . , 500 80.





  • qc 10 , 10 — . , .





, . , , , — .





-. , OCR- , .





?

, , Dropbox. . , , . , , , , , " , " .





, , . , "Machine Learning Deep Learning", NVIDIA.





, :





  • Data Scientist





  • Data Analyst





  • Data Engineering









  • Fullstack- Python





  • Java-





  • QA- JAVA





  • Frontend-









  • C++





  • Unity





  • -





  • iOS-





  • Android-









  • Machine Learning





  • "Machine Learning Deep Learning"





  • " Data Science"





  • " Machine Learning Data Science"





  • "Python -"





  • " "









  • DevOps








All Articles