
Die langfristige Praxis zeigt, dass die Zeit, die benötigt wird, um Raumfahrtmotoren von Beginn der Arbeiten auf den Markt zu bringen, 5 bis 7 Jahre beträgt. Gleichzeitig ist es zur Aufrechterhaltung einer führenden Position erforderlich, die Entwicklungs- und Fertigungszeit auf 3 bis 4 Jahre zu verkürzen. Darüber hinaus hat die Verschärfung des Wettbewerbs dazu geführt, dass die Kosten für hergestellte Motoren um 30-50% gesenkt werden müssen.
Diese Indikatoren können ohne die Einführung moderner digitaler Technologien nicht erreicht werden. Die fortschrittlichsten Unternehmen verfolgen innovative Ansätze nicht nur in allen Produktionsphasen, sondern auch in allen Phasen des Lebenszyklus ihrer Produkte. Je mehr Unternehmen digitalisieren, desto akuter wird die Frage: Wie können Big Data optimal für sich selbst genutzt werden?
Über 90 Jahre Arbeit NPO Energomash hat ein jahrhundertealtes Volumen an Dokumenten (sowohl in Papierform als auch in elektronischer Form) mit wertvollen Informationen über die Entwicklungen von Testern und Designern gesammelt. Die meisten Dokumente sind bereits in den Informationssystemen (IS) des Unternehmens gespeichert. Laut IDC-ForschungIm Durchschnitt verwenden Mitarbeiter großer Organisationen 5-6 interne ISs. Im Durchschnitt werden etwa 36% der Zeit für die Suche nach Informationen aufgewendet - in einem großen Unternehmen sind dies Tausende von Arbeitsstunden pro Tag.
Heute erfahren Sie, wie wir NPO Energomash bei der Entwicklung eines intelligenten Informationsabrufsystems (KIIPS) für Unternehmen unterstützt haben, das auf ABBYY Intelligent Search basiert - so bequem und schnell wie beliebte Suchmaschinen.
Was macht Energomash und was hat Gagarin damit zu tun?

Heute ist Energomash Teil des staatlichen Unternehmens Roscosmos und leitet die integrierte Struktur des Raketenantriebs, zu der auch die führenden Unternehmen dieser Branche gehören.
In den letzten Jahren hat das Unternehmen aktiv IT-Großlösungen eingeführt, die Datenanalyse, maschinelles Lernen und alle Funktionen von Technologien zur Verarbeitung natürlicher Sprache in großem Umfang nutzen. Das Unternehmen hat sich das strategische Ziel gesetzt, bis 2021 vollständig digital zu produzieren.
Zum Beispiel im Rahmen des Projekts " Digitale Design- und Produktionstechnologien»Eine der Hauptaufgaben war die Implementierung eines PLM-Systems (automatisiertes Product Lifecycle Management System). Ziel ist es, die Erstellung einer elektronischen Konstruktionsdokumentation (ECD) und deren Modellierung auf der Grundlage des Betriebs des Motors und anderer Arbeitsprozesse in den Technologie- und Produktionsabteilungen von NPO Energomash sowie die Bereitschaft zum Austausch von ECD zwischen den Industrieunternehmen sicherzustellen.
Warum war es notwendig, das Universum von Energomash zu durchsuchen?
Um das strategische Ziel der Schaffung einer digitalen Produktion zu erreichen, führt das Unternehmen eine ganze Reihe von Projekten durch, die auf der Arbeit mit großen Datenmengen basieren. Eines davon ist ein Projekt zur Schaffung eines intelligenten Informationsabrufsystems für Unternehmen.
Ziel des Projekts ist es, das Wissen und die Kompetenz des Unternehmens, das sich über Jahrzehnte der Arbeit angesammelt hat, zu bewahren, zu erweitern und in den Dienst der digitalen Produktion zu stellen.
Im Rahmen des Projekts wurden zwei Aufgaben gelöst:
1). Erleichtern Sie Designern und Ingenieuren das Auffinden nützlicher Informationen in Dokumenten der vergangenen Jahre.
Viele Entwicklungen wurden in der UdSSR geschaffen, aber nicht alle wurden umgesetzt, weil nicht immer Investitionen für sie bereitgestellt wurden oder der Stand der technologischen Entwicklung die Fertigstellung des Plans nicht ermöglichte. In unserer Zeit können solche Entwicklungen ein zweites Leben finden. Zu diesem Zweck bittet das Unternehmen erfahrene Designer, ihre Forschungsarbeiten und Zeichnungen, die noch auf Papier sind, zu teilen. Dies wird dazu beitragen, wertvolle Daten zu digitalisieren, sie über viele Jahre aufzubewahren und Wissen an die jüngere Generation von Wissenschaftlern und Ingenieuren weiterzugeben.
Natürlich gab es in Energomash schon früher die Suche nach Dokumenten in elektronischen Systemen, aber für die Mitarbeiter war es nicht einfach, die Informationen zu finden, die sie für die Arbeit benötigten.
Unter dem Spoiler werden wir Ihnen detaillierter erklären, wie dieser Prozess früher angeordnet wurde.
7 . , - , , - – , , . , , :
, , , , . , , : . , .
:
. « » () , . , « », , , , , , . , , . - , «».
, , , , , .
- ;
- ;
- , , .
, , , , . , , : . , .
:
- . , , ;
- , , .
. « » () , . , « », , , , , , . , , . - , «».
, , , , , .
2). Vereinfachen und beschleunigen Sie die Suche nach Daten für Serviceabteilungen: Buchhalter, Anwälte und andere Spezialisten, die Dokumente in Buchhaltungssystemen erstellen, bearbeiten, koordinieren und Informationen austauschen.
Das Unternehmen wollte, dass die Mitarbeiter in der Lage sind, die Finanz-, Fertigungs- und anderen relevanten Informationen zu sammeln und zu analysieren, die sie benötigen, um ihre Arbeit in unterschiedlichen Unternehmenssystemen zu erledigen, indem sie einfach Abfragen in eine Suchzeichenfolge eingeben. Es war notwendig, einen einzigen Zugangspunkt zu den in den Informationssystemen des Unternehmens gespeicherten Daten zu schaffen, wobei je nach Autorität des Benutzers in jedem System ein begrenzter Zugang zu Informationen bereitgestellt wurde.
Warum ist es wichtig? In 7 Jahren wird mehr als die Hälfte aller Daten weltweit in Unternehmenssystemen gespeichertSeagate und IDC Data Age Report . Um immer die notwendigen Informationen zur Hand zu haben, müssen Sie diese schnell finden. Laut einer Studie von IDC und ABBYY "Der Markt für künstliche Intelligenz in Russland" sehen Vertreter der IT (48%) und der Geschäftsbereiche (33%) daher große Chancen, KI in den nächsten zwei Jahren für die Unternehmenssuche und die Klassifizierung von Dokumenten einzusetzen.
Um diese Aufgaben zu bewältigen, benötigte das Unternehmen eine bequeme End-to-End-Suche über zahlreiche IPs hinweg. Energomash erwog mehrere Suchmaschinen, entschied sich jedoch letztendlich für ABBYY Intelligent Search. Die Auswahl wurde zum einen durch die Verfügbarkeit von Verarbeitungstechnologien in natürlicher Sprache beeinflusst, mit denen Sie Dokumente, die für Suchanfragen relevant sind, nach Bedeutung und nicht nur nach Schlüsselwörtern finden können. Zweitens die Möglichkeit, Benutzerzugriffsrechte auf Suchergebnisse zu unterscheiden. Wir werden Ihnen etwas später und jetzt mehr darüber erzählen - wie wir angefangen haben.
Der erste "Ausgang" zur Suche
Energomash hat beschlossen, die Arbeit der intelligenten Suche an dreitausend Dokumenten aus der Informationsdatenbank (IDB) von Forschungs-, Entwurfs- und Berechnungsarbeiten zu überprüfen.
Zu diesem Zweck hat ABBYY einen Prototyp eines Konnektors zur IDB entwickelt, der ABBYY Intelligent Search mit der Dokumentenbasis verknüpft. Ein Connector ist ein Java-Programm, mit dem Dokumente in einen Index geladen werden. Wie es funktioniert?
1). Zuerst erstellen wir einen Volltextsuchindex
Ein Volltextindex ist grob gesagt eine Liste aller Wörter in einem Dokument und seiner Metadaten (Dokumentennummer, Titel, Erstellungsdatum). Der Volltextindex wird recht schnell erstellt und ermöglicht es Ihnen, nach den erforderlichen Informationen anhand von Schlüsselwörtern zu suchen - denjenigen, die im Text vorkommen.


Um einen Volltextindex zu erstellen, benötigen Sie einen Connector. Es verbindet die Suchlösung mit einem bestimmten Informationssystem und sammelt ("Indizes") die Merkmale jedes Dokuments, zum Beispiel:
- den Namen der IP, in der die Datei gespeichert ist,
- das Datum der letzten Änderung des Dokuments,
- die Version des Dokuments in der Quelle,
- Dokumentformat,
- die Codes der Sprachen, in denen das Dokument erstellt wurde,
- Pfad zum Dokument im IS,
- Datum der letzten Indizierung des Dokuments
- usw.
Diese Eigenschaften werden in Zukunft nicht nur dazu beitragen, die Suche nach einem Dokument zu beschleunigen, sondern auch die Logik der Arbeit mit ihnen für den Connector zu vereinfachen. Insbesondere analysiert der Connector verschiedene Versionen desselben Dokuments, um nur die letzte in den Index aufzunehmen. Der Connector empfängt auch Informationen zu Dokumenten, die aus der Quelle entfernt wurden.
Ein in ABBYY Intelligent Search integrierter Crawler (Suchroboter) hilft beim Erstellen eines Suchindex. In regelmäßigen Abständen fragt er die Konnektoren ab, prüft, ob neue Dokumente im IS erschienen sind, welche Dokumente gelöscht wurden und wie sich die Zugriffsrechte auf Dokumente geändert haben. Dementsprechend wird der Index mit einer bestimmten Häufigkeit aktualisiert.
Es werden nicht nur Textdokumente indiziert, sondern auch Grafikdateien. Beispielsweise können Kopien von Zeichnungen in JPEG oder PDF ohne Textebene gescannt werden. Bei der Arbeit mit Bildern erkennt die Suchlösung den Text zunächst automatisch und fügt ihn dem Suchindex hinzu.
Darüber hinaus kann das System ZIP-, RAR- und TAR-Archivdateien verarbeiten, sofern diese nicht kennwortgeschützt sind. Die Archive werden entpackt, Bilder von ihnen erkannt, der Text indiziert.


Der Suchindex enthält eine beliebige Reihe von Feldern, mit denen auch Suchergebnisse (Dokumentautor, Erstellungsdatum, Produktnummer usw.) gefiltert werden können.
2). Dann wenden wir Technologien zur Verarbeitung natürlicher Sprache an
Im Hintergrund wird der Suchindex mit semantischen Informationen angereichert . Dazu haben wir die semantisch-linguistische Ontologie verwendet, die wir bereits haben - mit anderen Worten, Beschreibungen von Objekten und Phänomenen der realen Welt. Wir haben bereits darüber gesprochen, wie wir dieses Modell hier und hier auf Habré erstellt haben .
Mithilfe von Technologien für maschinelles Lernen und Verarbeitung natürlicher Sprache analysiert jedes Dokument die Syntax von Sätzen, Morphologie und semantischen Bedeutungen von buchstäblich jedem Wort im Text. Diese Informationen ergänzen den Suchindex und ermöglichen die Suche nicht nach Schlüsselwörtern, sondern nach Synonymen, Hyponymenund andere Konstrukte, die dieselbe Bedeutung, aber in unterschiedlichen Ausdrücken vermitteln. Daher sucht die Suchmaschine genauer nach Informationen in Unternehmensquellen.


Es ist sehr praktisch, wenn unser Kollege eine Suchanfrage in eigenen Worten formuliert hat und vor 40 Jahren Dokumente suchen möchte, in denen das von ihm benötigte Thema möglicherweise mit anderen Begriffen bezeichnet wurde. Beispielsweise wählt das System für die Abfrage "Rahmenfehler" alle möglichen semantischen Ausdrücke aus, die diesem Begriff zugeordnet sind. Die Ergebnisse können " Durchbiegung ", " Loch ", " Knick " oder "die Tatsache der Verletzung der technologischen Dokumentation des Entwurfs " umfassen.
Hier ist ein weiteres Beispiel:

In den Suchergebnissen für " Schubschwankungen " werden auch Texte angezeigt, die den Ausdruck " Schubvariation " enthalten.
Mithilfe von Technologien zur Verarbeitung natürlicher Sprache kann die Suchmaschine auch Rechtschreibfehler im Text der Abfrage automatisch korrigieren. Beispielsweise wird das System verstehen, dass das Wort "Peilung" Fehler enthält, und sofort nach Dokumenten suchen, in denen "Peilung" erwähnt wird.
Ergebnisse des ersten Starts
Um die Arbeit einer intelligenten Suchmaschine zu bewerten, haben die Energomash-Spezialisten mithilfe der in die IDB integrierten Suchmaschine und der intelligenten ABBYY-Suche etwa 30 Abfragen nach IDB-Dokumenten durchgeführt . Dann verglichen sie die Suchergebnisse: Welche Dokumente wurden von beiden Systemen gefunden, welche Phrasen wurden in Ausschnitten hervorgehoben. Infolgedessen lieferte die in die IDB integrierte Suche für einige Abfragen keine Ergebnisse, da nur Schlüsselwörter erkannt werden können, keine geschlossenen. ABBYY Intelligent Search hat Dokumente zurückgegeben, die für alle Abfragen relevant sind.
Was die Geschwindigkeit betrifft, während die Anforderungen für die Hardwareplattform erfüllt werdenDie Suchantwort überschritt nicht den Bruchteil einer Sekunde, wie bei gängigen Suchmaschinen. Die komplexesten Abfragen dauerten maximal 3 Sekunden.
Nach einem erfolgreichen Pilotprojekt entschied sich Energomash für die ABBYY Intelligent Search-Lösung im Herzen des Corporate Intelligent Information Search Systems.
Gehen wir weiter
Energomash verband 7 Unternehmensquellen mit der Suche: LanDocs elektronisches Dokumentenmanagementsystem, Dateispeicherung, IDB, TeamCenter-Systemlebenszyklus-Support-System, Galaktika ERP- und AMM-Ressourcenmanagementsystem sowie Projektmanagement-Informationssystem. Für jedes Informationssystem wurde ein separater Index erstellt. Dies macht die Suchmaschine in der Verwaltung flexibel und ermöglicht es, den Index für jedes System separat neu zu erstellen und neue Bedingungen festzulegen. Der Zugriff auf das Corporate Search System erfolgt über das unternehmensinterne Portal auf der Hauptseite. Das Projekt wurde gemeinsam mit einem Partner, LANIT , der größten diversifizierten russischen Gruppe von IT-Unternehmen, durchgeführt.
Die Hauptmodule des Unternehmenssuchsystems:
- Hauptseite von Suchanfragen und Suchergebnissen;
- Admin-Panel (Einrichten von Indizes, Filtern und Metadaten für jedes Informationssystem);
- Statistik der Anzahl der Dokumente (zeigt die Anzahl der Dokumente im Index für jedes Informationssystem für den Zeitraum an).
Das Unternehmenssuchsystem wird seit dem 1. Juli 2020 in Betrieb genommen. Zum Zeitpunkt des Starts wurden 500.000 Dokumente indexiert. Es wird erwartet, dass bis Ende des Jahres mit der aktiven Nutzung des Systems und der Verbindung neuer Informationsquellen die Anzahl der Dokumente im Index mehr als 1 Million erreichen wird.
So stellen Sie die Sicherheit sicher
Wie jedes große Unternehmen verfügt NPO Energomash über Dokumente, auf die nicht alle Mitarbeiter zugreifen können. Die wichtigste Sicherheitsanforderung beim Start des Projekts bestand darin, den Zugriff auf Dokumente gemäß dem Vorbild jedes Informationssystems zu ermöglichen. Dafür wurde getan:
1). Lokale Speicherung von Informationen
Die ABBYY-Suchlösung wird auf einem separaten Server im internen Schaltkreis von NPO Energomash bereitgestellt. Dort werden alle Suchindizes und deren Backups bei Verlust sowie deren Einstellungen gespeichert.
2). Vorbild des Informationssystems
Aus Sicherheitsgründen ist die Differenzierung der Benutzerzugriffsrechte auf Suchergebnisse für jedes Informationssystem organisiert. Alle mit ABBYY Intelligent Search verbundenen Unternehmenssysteme unterstützen die Domänenautorisierung. Der Benutzer meldet sich unter einem Domänenkonto beim System an, führt eine Anforderung aus und sieht das Dokument in den Suchergebnissen. Dabei werden die Einstellungen für die Dokumentvorschau für jedes Informationssystem und die direkt im Unternehmenssuchsystem selbst vorgenommene Zugriffsebene sowie der Zugriff auf das Dokument im Quellinformationssystem selbst berücksichtigt ... Wenn der Benutzer Rechte hat, mit dem Dokument im Quellsystem zu arbeiten, kann der Übergang zum Originaldokument direkt vom Unternehmenssuchsystem aus durch Klicken auf den Link erfolgen.
Pläne für die Zukunft
Nach der Idee von Energomash wird der intelligente Informationsabruf dazu beitragen, Geschäftsprozesse im Unternehmen zu vereinfachen und zu beschleunigen, beispielsweise indirekt den Markteintritt neuer Produkte zu beschleunigen, deren Qualität zu verbessern und die Kosten zu senken. Ideen und Projekte, die in alten Dokumenten erhalten geblieben sind, können in modernen Entwicklungen des Unternehmens verwendet werden. Schaffen Sie zum Beispiel auf der Grundlage von Entwicklungen etwas völlig Neues und bleiben Sie den Wettbewerbern auf dem Weltmarkt voraus.
Lassen Sie uns auch unsere Pläne für die Zukunft erwähnen:
- In Zukunft ist geplant, Informationsquellen anderer Unternehmen, die Teil der Energomash-Struktur sind, mit dem Unternehmenssuchsystem zu verbinden. In diesem Fall kann der Suchindex auf 2 Millionen Dokumente erweitert werden.
- , , – . , - . , , : , - , . , , . , , .
- Energomash plant auch, die Möglichkeit zu untersuchen, komplexe Analyseberichte mithilfe der Suchfunktion zu erstellen.
Welche anderen Aufgaben können Sie Ihrer Meinung nach mit der Unternehmenssuche lösen?