Generieren einzigartiger Ideen für Data Science-Projekte in 5 Schritten

Der wahrscheinlich schwierigste Teil eines Data Science-Projekts besteht darin, eine originelle, aber realisierbare Idee zu entwickeln. Ein Experte, der nach einer solchen Idee sucht, kann leicht in die "Datensatzfalle" geraten. Er verbringt viele Stunden damit, vorhandene Datensätze zu durchsuchen und interessante neue Ideen zu entwickeln. Dieser Ansatz hat jedoch ein Problem. Tatsache ist, dass jemand, der nur vorhandene Datensätze betrachtet (mit Kaggle , Google Datasets , FiveThirtyEight ), seine Kreativität einschränkt und nur einen kleinen Satz von Aufgaben sieht, auf die sich die von ihm untersuchten Datensätze konzentrieren.



Manchmal mag ich es, die Datensätze zu erkunden, die mich interessieren. Wenn ich ein erfolgreiches Modell für Daten von Kaggle erstelle, für das bereits unzählige Modelle erstellt wurden, gibt es keinen praktischen Wert, aber es ermöglicht mir zumindest, etwas Neues zu lernen. Aber Datenwissenschaftler sind Menschen, die danach streben, etwas Neues, Einzigartiges zu schaffen, das der Welt echten Nutzen bringen kann.







Wie generieren Sie neue Ideen? Um die Antwort auf diese Frage zu finden, habe ich meine eigenen Erfahrungen und die Ergebnisse der Kreativitätsforschung kombiniert. Dies führte dazu, dass ich 5 Fragen formulieren konnte, deren Antworten helfen, neue Ideen zu finden. Hier werde ich auch Beispiele für Ideen geben, die dank der von mir vorgeschlagenen Methodik gefunden wurden. Wenn Sie nach Antworten auf die hier gestellten Fragen suchen, gehen Sie den Weg, um neue Ideen zu generieren, und können Ihr kreatives Potenzial voll ausschöpfen. Als Ergebnis erhalten Sie neue einzigartige Ideen, die Sie in Ihre Data Science-Projekte implementieren können.



1. Warum möchte ich an einem neuen Projekt arbeiten?



Wenn Sie darüber nachdenken, ein neues Projekt zu starten, haben Sie eine Absicht oder ein Ziel im Kopf. Zunächst müssen Sie die Antwort auf die Frage finden, warum Sie ein weiteres Projekt im Bereich der Datenwissenschaft erstellen möchten. Wenn Sie einen groben Überblick darüber haben, welches Ziel Sie anstreben, können Sie sich darauf konzentrieren, eine Idee zu finden. Überlegen Sie sich also, wofür Sie das Projekt erstellen möchten. Hier sind einige Optionen:



  • Dies ist ein Portfolio-Projekt, das Sie potenziellen Arbeitgebern vorstellen werden.
  • Dies ist ein Entwurf für einen Artikel über Konzepte, Modelle oder explorative Datenanalysen.
  • Dies ist ein Projekt, mit dem Sie etwas üben können. Zum Beispiel können wir über die Verarbeitung natürlicher Sprache, über die Datenvisualisierung, über die primäre Datenverarbeitung und über einen bestimmten Algorithmus für maschinelles Lernen sprechen.
  • Dies ist ein ganz besonderes Projekt, das in dieser Liste nicht beschrieben wird.


2. Welche Bereiche sind meine Interessen und meine Erfahrung?



Es gibt drei Hauptgründe, über diese Frage nachzudenken.



  • Denken Sie zunächst an die in der Datenwissenschaft verwendeten Venn-Diagramme , um die in diesem Bereich erforderlichen Fähigkeiten zu beschreiben. Kenntnisse in einem bestimmten Bereich sind ein wichtiges Kapital , über das jeder Datenwissenschaftler verfügen sollte. Es ist nur dann möglich, bestimmte Probleme durch Datenverarbeitung zu lösen, wenn der Themenbereich, zu dem diese Daten gehören, klar ist. Andernfalls werden Algorithmen angewendet, Visualisierungen und Vorhersagen erstellt, die für jeden Praktiker mit dem entsprechenden Profil unangemessen erscheinen. Und wenn das, was Sie tun, keinen Sinn ergibt, warum sollten Sie es dann überhaupt tun?
  • -, , , , . , . , . , , .
  • -, , , . , , - . 


Lassen Sie mich Ihnen ein Beispiel geben. Zu den Wissensgebieten, die mich interessieren und in denen ich Erfahrung habe, gehören die ökologische und sozioökonomische Nachhaltigkeit von Systemen, Finanzen, Populärkultur und Verarbeitung natürlicher Sprache. Wenn ich mich auf diese Themen konzentriere, kann ich das nutzen, was ich bereits habe. Dank dieses Wissens entscheide ich, ob ich, inspiriert von etwas, eine neue Idee entwickeln kann, die umgesetzt werden kann.



3. Wie findest du Inspiration?



Die Hauptinspirationsquelle ist das Lesen. Auf der Suche nach einer Idee finden Sie interessante Themen, indem Sie verschiedene Materialien lesen:



  • , , . , , . , WIRED , , Google . , . , Google.
  • . , . , GPT-2 , , , , , , . - ?
  • . , , Data Science, , . , NLP- «», , , . - ? , ? GPT-2.


Wenn wir über andere Inspirationsquellen sprechen, kann Inspiration im Alltag gefunden werden, ohne sich neuen Ideen zu verschließen. Wenn Sie an einer Frage interessiert sind, überlegen Sie, ob Sie diese Frage mithilfe von Datenmanipulationstechniken beantworten können. Zum Beispiel bin ich kürzlich auf einen Trailer für Boys TV-Serien gestoßen und habe auf IMDb viele positive Kritiken darüber gefunden. "Gibt es eine Bestätigung dafür, dass die Anzahl gewalttätiger Szenen in Fernsehsendungen mit der Zeit zunimmt ?", Fragte ich mich. "Gibt es ein ständig wachsendes Publikum, das gewalttätige TV-Shows mag?", Fuhr ich fort. Wenn Sie etwas interessiert, nehmen Sie sich einen Moment Zeit und studieren Sie die relevanten Daten.



Wie generieren Sie Projektideen basierend auf den oben genannten Inspirationsquellen? Neurowissenschaftler haben drei unterschiedliche psychologische Prozesse identifiziert, die mit der Generierung von Ideen verbunden sind:



  • Sie können vorhandene Ideen kombinieren, um neue zu erstellen (kombinatorische Kreativität). Beispielsweise analysierten verschiedene Projekte Mietangebote, die auf Airbnb veröffentlicht wurden. Es gibt Projekte zur Analyse des Immobilienmarktes. Wenn Sie diese Ideen kombinieren, können Sie nach einer Antwort auf die Frage suchen, ob die Immobilienpreise in einer bestimmten Stadt dank Airbnb steigen.
  • , ( ). , -, , , . , , - .
  • - , ( ). — . . . : , , .


4. ?



Sobald Sie sich für die allgemeine Forschungsrichtung entschieden haben, müssen Sie nach Daten suchen, mit denen Sie verstehen, wie Sie Ihre Idee in Form eines Data Science-Projekts umsetzen können. Dies ist äußerst wichtig, um festzustellen, ob eine Idee erfolgreich sein wird. Bei der Beantwortung der Frage im Titel dieses Abschnitts sollten Sie die Möglichkeit berücksichtigen, das, was Sie benötigen, in vorhandenen Datenspeichern zu haben. Möglicherweise müssen Sie die erforderlichen Daten selbst erfassen, was die Aufgabe erschwert. Hier ist eine Übersicht über Datenquellen:





Wenn Sie keine Daten finden, die Ihnen bei der Umsetzung Ihrer Projektidee helfen können, formulieren Sie die Idee neu. Versuchen Sie, eine Idee aus der ursprünglichen Idee zu erhalten, die mit den vorhandenen Daten implementiert werden kann. Stellen Sie sich in der Zwischenzeit eine Frage, warum Sie die benötigten Daten nicht finden können. Was ist los mit dem Bereich, an dem Sie interessiert sind? Was können Sie dagegen tun? Allein die Beantwortung dieser Fragen kann zur Entstehung eines neuen Data Science-Projekts führen.



5. Ist die gefundene Idee realisierbar?



Sie haben also eine fantastische Idee! Aber kann es umgesetzt werden? Führen Sie die Schritte des Ideengenerierungsprozesses erneut durch. Überlegen Sie, was Sie erreichen möchten (Frage 1), interessieren Sie sich für den ausgewählten Bereich, wenn Sie Erfahrung darin haben (Frage 2), verfügen Sie über die Daten, die zur Umsetzung der Idee erforderlich sind (Frage 4). Jetzt müssen Sie Folgendes bestimmen: Verfügen Sie über die erforderlichen Fähigkeiten, um die Idee umzusetzen und das Ziel zu erreichen?



Es ist wichtig, einen Faktor wie die Zeit zu berücksichtigen, die Sie für dieses Projekt aufwenden möchten. Sie werden wahrscheinlich keine Doktorarbeit zu dem von Ihnen gewählten Thema schreiben. Daher wirkt sich das Projekt, das Sie im Rahmen der gefundenen Idee durchführen, möglicherweise nur auf einen bestimmten Teil davon aus. Vielleicht besteht es nur darin, etwas Neues zu lernen. Sie müssen die Idee in Zukunft umsetzen.



Nachdem Sie die 5 oben genannten Schritte zum Generieren einer Idee ausgeführt haben, sollten Sie eine Frage haben, die Sie beantworten können und möchten. Dabei sollten Sie so viel Zeit darauf verwenden, wie Sie bereit sind, um Ihr Ziel zu erreichen.



Ergebnis



  • . , , , . — , , , . — . , , .
  • - . . , - , . , . , , , , .
  • Hab keine Angst, von vorne zu beginnen. Was auch immer Sie tun, Sie lernen immer etwas Neues. Jedes Mal, wenn Sie eine Codezeile schreiben, üben und erweitern Sie Ihr Wissen und Ihre Fähigkeiten. Wenn Sie festgestellt haben, dass die Umsetzung der gefundenen Idee Sie Ihrem Ziel nicht näher bringt, oder wenn sich herausstellt, dass die Idee nicht realisierbar ist, haben Sie keine Angst, sie zu verlassen und weiterzumachen. Die Zeit, die Sie für die Suche nach dieser Idee aufgewendet haben, geht für Sie nicht verloren. Es ist notwendig, die Vorteile, die sich aus der Umsetzung der Idee ergeben, sinnvoll zu bewerten.


Mit der hier beschriebenen Technik finde ich ständig originelle Ideen für meine Data Science-Projekte. Ich hoffe, diese Technik ist auch für Sie nützlich.



Wie suchen Sie nach neuen Ideen für Ihre Data Science-Projekte?










All Articles