🧜🏾 🐰 👤 So erhalten Sie ein Data Scientist-Interview bei Amazon im Jahr 2021 👤 🧀 🕦

Ich habe beschlossen, einen Artikel für alle zu schreiben, die versuchen, relevante Fragen und Antworten zu Amazon-Interviews zu finden. Ich habe einige Interviewfragen beantwortet, die in den letzten Monaten gestellt wurden, und versucht, präzise und klare Antworten darauf zu geben. Es gibt schwierige Fragen, es gibt einfache, aber auf jeden Fall können beide nützlich sein.

F: Das Paar hat zwei Kinder und das Paar weiß, dass eines der Kinder ein Junge ist. Wie hoch ist die Wahrscheinlichkeit, dass das andere Kind ein Junge ist?

Hier gibt es keinen Haken. Die Wahrscheinlichkeit, dass ein Kind ein Junge ist, ist unabhängig vom anderen und beträgt 50%. Sie werden vielleicht durch Leonard Mlodinovs Frage verwirrt , bei der die Antwort ein Drittel beträgt, aber dies ist eine völlig andere Frage, die nicht mit unserer zusammenhängt.

F: Erklären Sie, was ein p-Wert ist.

Wenn Sie googeln, was ein p-Wert ist, erhalten Sie die folgende Antwort: „Dies ist die Wahrscheinlichkeit, für ein bestimmtes Wahrscheinlichkeitsmodell der Verteilung von Werten einer Zufallsvariablen den gleichen oder einen extremeren Wert der Statistik (Arithmetik) zu erhalten Mittelwert, Median usw.) im Vergleich zu den zuvor beobachteten, vorausgesetzt, die Nullhypothese ist korrekt. "

Ausführliche Antwort, aus dem Grund, dass p eine sehr spezifische Bedeutung hat und oft missverstanden wird.

Eine einfachere Definition eines p-Werts lautet: "Dies ist die Wahrscheinlichkeit, dass die beobachtete Statistik aufgrund der Verteilung der Stichprobe zufällig auftritt."

Alpha setzt den Standard dafür, wie extrem Werte sein müssen, bevor die Nullhypothese verworfen werden kann. Der p-Wert gibt das Extrem der Daten an.

F: Es gibt 4 rote und 2 blaue Kugeln. Wie hoch ist die Wahrscheinlichkeit, dass sie bei zwei Wahlen gleich sind?

Die Antwort ist die Wahrscheinlichkeit, dass beide rot sind, plus die Wahrscheinlichkeit, dass beide blau sind. Nehmen wir an, dass diese Frage ersatzlos ist.

Wahrscheinlichkeit von 2 Rottönen = (4/6) * (3/6) = 1/3 oder 33%
Wahrscheinlichkeit von 2 blau = (2/6) * (1/6) = 1/18 oder 5,6%

Daher beträgt die Wahrscheinlichkeit, dass die Bälle gleich sind, ungefähr 38,6%.

F: Beschreiben Sie den Baum, die SVM und die zufällige Gesamtstruktur. Erzählen Sie uns von ihren Vor- und Nachteilen.

Entscheidungsbäume: Ein Baummodell, mit dem Entscheidungen basierend auf einer oder mehreren Bedingungen modelliert werden.

Vorteile: Einfach zu implementieren, intuitiv, behandelt fehlende Werte.

Nachteile: hohe Varianz, ungenau

Vorteile: hohe Maßgenauigkeit

Nachteile: Tendenz zur Überanpassung, schätzt die Wahrscheinlichkeit nicht direkt ab

Vorteile: Kann eine höhere Präzision erzielen, fehlende Werte verarbeiten, keine Funktionsskalierung erforderlich, kann die Funktionsbedeutung bestimmen.

Nachteile: Black Box, rechenintensiv.

Bei der Dimensionsreduzierung wird die Anzahl der Features in einem Dataset reduziert. Dies ist vor allem dann wichtig, wenn Sie die Varianz Ihres Modells reduzieren möchten (Überanpassung).

Wikipedia nennt vier Vorteile der Dimensionsreduktion:

Reduziert die erforderliche Speicherzeit und den erforderlichen Speicherplatz.
Das Entfernen der Multikollinearität verbessert die Interpretation der Modellparameter des maschinellen Lernens.
Es wird einfacher, Daten zu visualisieren, wenn sie auf sehr kleine Dimensionen wie 2D oder 3D verkleinert werden.
Vermeidet den Fluch der Dimension.

Wir müssen einige Annahmen zu dieser Frage treffen, bevor wir sie beantworten können. Angenommen, es gibt zwei mögliche Standorte, an denen Sie einen bestimmten Artikel bei Amazon kaufen können, und die Wahrscheinlichkeit, ihn an Standort A zu finden, beträgt 0,6 und B 0,8. Die Wahrscheinlichkeit, ein Produkt bei Amazon zu finden, kann wie folgt erklärt werden:

Wir können das oben Gesagte als P (A) = 0,6 und P (B) = 0,8 umformulieren. Nehmen wir außerdem an, dass dies unabhängige Ereignisse sind, was bedeutet, dass die Wahrscheinlichkeit eines Ereignisses nicht von einem anderen abhängt. Wir können dann die Formel verwenden ...

P (A oder B) = P (A) + P (B) - P (A und B)

P (A oder B) = 0,6 + 0,8 - (0,6 * 0, 8)

P (A oder B) = 0,92

F: Wenn 8 Bälle mit gleichem Gewicht und 1 Ball etwas mehr wiegen (insgesamt 9 Bälle), wie viele Wägungen sind erforderlich, um festzustellen, welcher Ball der schwerste ist?

Es sind zwei Wägungen erforderlich (siehe Teile A und B oben):

Sie müssen die neun Kugeln in drei Dreiergruppen aufteilen und zwei Gruppen wiegen. Wenn die Skalen ausgeglichen sind (Option 1), wissen Sie, dass der schwere Ball zur dritten Gruppe von Bällen gehört. Andernfalls nehmen Sie eine Gruppe mit einem großen Gewicht (Option 2).

Dann folgen Sie dem gleichen Schritt, aber Sie haben drei Gruppen von einem Ballon anstelle von drei Gruppen von drei.

F: Was ist "Umschulung"?

Eine Überanpassung ist ein Fehler, wenn ein Modell zu gut zu den Daten „passt“, was zu einem Modell mit hoher Varianz und geringer Verzerrung führt. Infolgedessen sagt das Überanpassungsmodell neue Datenpunkte ungenau voraus, selbst wenn die Trainingsdaten eine hohe Wiedergabetreue aufweisen.

F: Wir haben zwei Modelle, eines mit einer Genauigkeit von 85% und das andere mit einer Genauigkeit von 82%. Wen wirst du Wählen?

Wenn wir uns nur um die Genauigkeit des Modells kümmern, lautet die Antwort 85%. Wenn der Interviewer jedoch danach fragt, lohnt es sich wahrscheinlich herauszufinden, in welchem Kontext die Frage gestellt wird, d. H. was das Modell vorherzusagen versucht. Dies gibt uns eine bessere Vorstellung davon, ob die Bewertungsmetrik wirklich Genauigkeit sein sollte oder eine andere Metrik wie Rückruf oder F1-Punktzahl.

F: Was ist ein naiver Bayes'scher Algorithmus?

Der Naive Bayesian Classifier ist ein beliebter Klassifikator, der in Data Science verwendet wird. Die Idee dahinter basiert auf dem Satz von Bayes:

Bild

In einfachen Worten wird diese Gleichung verwendet, um die nächste Frage zu beantworten. „Wie groß ist die Wahrscheinlichkeit, dass y (meine Ausgabevariable) mit X (meine Eingabevariablen) übereinstimmt? Und aufgrund der naiven Annahme, dass die Variablen für eine bestimmte Klasse unabhängig sind, können Sie Folgendes sagen:

Bild

Wenn Sie den Nenner entfernen, können Sie auch sagen, dass P (y | X) proportional zur rechten Seite ist.

Bild

Ziel ist es daher, die Klasse mit der höchsten proportionalen Wahrscheinlichkeit zu finden.

F: Wie wirkt sich eine Änderung des Grundbeitrags auf den Markt aus?

Ich bin mir über die Antwort auf diese Frage nicht 100% sicher, aber ich werde mein Bestes geben!

Nehmen wir ein Beispiel für die Erhöhung des Mitgliedsbeitrags - es sind zwei Parteien beteiligt: Käufer und Verkäufer.

Für Käufer hängt die Auswirkung einer Erhöhung des Grundbeitrags letztendlich von der Preiselastizität der Nachfrage nach Käufern ab. Wenn die Preiselastizität hoch ist, führt eine bestimmte Preiserhöhung zu einem deutlichen Nachfragerückgang und umgekehrt. Käufer, die weiterhin Mitgliedsbeiträge kaufen, sind wahrscheinlich die loyalsten und aktivsten Kunden von Amazon - sie werden wahrscheinlich auch Premium-Produkten mehr Aufmerksamkeit schenken.

Verkäufer werden darunter leiden, da die Kosten für den Kauf eines Korbs mit Amazon-Produkten jetzt höher sind. Dadurch werden einige Lebensmittel stärker betroffen, während andere dies möglicherweise nicht tun. Es ist wahrscheinlich, dass die Premiumprodukte, die die loyalsten Kunden von Amazon kaufen, nicht so stark betroffen sind wie die Elektronik.

Vielen Dank für Ihre Aufmerksamkeit!

Was ich an diesen Interviews und den Themen, mit denen sie sich befassen, liebe, sind zwei Dinge:

Sie helfen Ihnen dabei, neue Konzepte zu erlernen, mit denen Sie vorher nicht vertraut waren.
Sie eröffnen Konzepte, die Sie aus einem neuen Blickwinkel kennen.

Ich hoffe, all dies wird Ihnen helfen, sich auf Ihre Reise in die Welt der Data Science vorzubereiten!

, Data Science AR- Banuba - Skillbox.

, -: , , . «» .

« ». . , , , .

:

1) , ?

2) ?

3) ?

4) , , -?

5) , ?

, .

So erhalten Sie ein Data Scientist-Interview bei Amazon im Jahr 2021

More articles: