HMM: Betrügerische Transaktionen abfangen

Drei Jahre lang arbeitete ich in Serbien als iOS-Evangelist - es gab zwei spezialisierte Projekte und ein maschinelles Lernen.





Wenn Sie interessiert sind, begrüßen Sie in der Welt von HMM.





Formulierung des Problems

Österreichische Bank. Er hat viele Kunden, Kunden haben ein Konto bei dieser Bank. Während des Jahres gibt der Kunde Geld von seinem Konto aus. Er geht in Geschäfte, löscht Stromrechnungen usw. Jede Abhebung von einem Konto wird als Transaktion bezeichnet. Eine Abfolge von Transaktionen wird für eine bestimmte Zeit (z. B. ein Jahr) angegeben. Es ist notwendig, die Maschine so zu trainieren, dass neue Transaktionen als gültig oder verdächtig überprüft werden. Und gab im letzteren Fall eine Warnung heraus. Um das Problem zu lösen, müssen Sie das Hidden Markov-Modell verwenden.





Einführung in HMM

Ich bekomme jedes Jahr 10 Tage hintereinander Coronavirus. Den Rest der Tage ist er so gesund wie ein Bulle.





Stellen wir diese Folge von 365 Zeichen als Array dar. h bedeutet gesund, l bedeutet krank.





days{365} = {hhhhhhhhhhllllllllllhhhhhhhhhhhhhhhhhhhhhhhh...hhhhh}
      
      



Frage - Wie hoch ist die Wahrscheinlichkeit, dass ich heute krank bin?





\ frac {10} {365}= 3 Prozent





, , 15 HMM. - .





- , ?





: - ?





( - 10), \ frac {9} {10}= 90 10 .





? -





\ frac {1} {355}= 0.3 99.7% .





, 10% 90% .





4 , 2 2 - ! . , 0 1, .





















0.997





0.003









0.10





0.90





, , 0.997 , 0.003 .





/? .





, .





27.10.2020 00:00 GAZPROMNEFT AZS 219    2507,43 118 753,95 28.10.2020 / 298380 
 26.10.2020 14:45 SPAR 77                319,73 121 261,38 27.10.2020 / 220146 
 26.10.2020 14:38 ATM 60006475           4800,00 121 581,11 26.10.2020 / 213074  
 25.10.2020 17:52 EUROSPAR 18            970,02 126 381,11 26.10.2020 / 259110 
 25.10.2020 00:00 Tinkoff Card2Card      20000,00 127 351,13 26.10.2020 / 253237   
 22.10.2020 14:22 SBOL  4276      7000,00 147 351,13 22.10.2020 / 276951   
 22.10.2020 12:18 STOLOVAYA              185,00 154 351,13 23.10.2020 / 279502   
 21.10.2020 16:46 MEGAFON R9290499831    500,00 154 536,13 21.10.2020 / 224592  , , .
 21.10.2020 14:17 SPAR 77                987,03 155 036,13 22.10.2020 / 219015 
 21.10.2020 13:42 PYATEROCHKA 646        289,93 156 023,16 22.10.2020 / 294539 
 21.10.2020 00:00 MEBEL                  75,00 156 313,09 22.10.2020 / 279935  
 19.10.2020 14:54 SPAR 77                552,92 132 044,80 20.10.2020 / 208987 
 19.10.2020 00:00 MOBILE FEE             60,00 132 597,72 20.10.2020 / -  
 16.10.2020 14:19 SPAR 77                579,39 132 657,72 17.10.2020 / 229627 
 12.10.2020 13:33 STOLOVAYA              185,00 133 237,11 13.10.2020 / 261374   
 12.10.2020 00:00 OOO MASTERHOST         1000,00 133 422,11 13.10.2020 / 268065  
 11.10.2020 12:09 SPAR 77                782,87 134 422,11 12.10.2020 / 275816 
 10.10.2020 14:52 SBOL            400,00 135 204,98 10.10.2020 / 276925   
 09.10.2020 13:29 SBOL  5484*     1000,00 135 604,98 09.10.2020 / 229184   
 09.10.2020 11:55 MAGNIT MK KRYUCHYA     274,00 136 604,98 10.10.2020 / 209914 

      
      



,





def readtrans():
    with open ("assets/trans.txt", "r") as file:
        grades = file.read()
    pattern = '(\d{2,5}),\d\d'
    result = re.findall(pattern, grades)
    r = list(map(int, result[0::2]))
    return r

data = readtrans()
t = list(range(len(data)))
df = pd.DataFrame({'number':t, 'amount':data})
ax1 = df.plot.bar(x='number', y='amount', rot=0, width=1.5)


      
      



- ( 10$) l, 100$ h, - m.









print(observations[:20])
trans[] = ['m', 'm', 'm', 'l', 'm', 'm', 'h', 'm', 'l', 'l', 'm', 'l', 'l', 'l', 'l', 'l', 'l', 'm', 'l', 'l']
      
      



. 3 3, 3 = {l,m,h}





[[0.5 0.3 0.2]
 [0.6 0.3 0.1]
 [0.7 0.3 0.0]]
      
      



- , 0.7 , 0.3 - .





, . - . - .





- ?! - . , . (), , . .





, , . - , , , , ...





, . , ?! . , 4-6 . . . -. . , 300 .





, 5 5 ( 5 5) 20 .





[[a1 a2 a3 a4 a5]
 [b1 b2 b3 b4 b5]
 [c1 c2 c3 c4 c5]
 [x1 x2 x3 x4 x5]
 [y1 y2 y3 y4 y5]]
      
      



20, 25 ( ). , , 5 .





( ) 5 3.





? , a ( )





l-, m-, h-.





[0.96 0.04 0.0]
      
      



100 . .





, , 20 10 .





20+10 , !





!





, .





hmm, - , . , 15-20 , .





.





.





Accord C#





using Accord.MachineLearning;
using Accord.Statistics.Models.Markov;
using Accord.Statistics.Models.Markov.Learning;
using Accord.Statistics.Models.Markov.Topology;
using Comtrade.FMS.Common;

      
      



, ( ) . -. , run- )) . 2010 .





Ich werde eine Codezeile angeben, in der die Lernmethode verschlüsselt ist.





var Lehrer = neues BaumWelchLearning (hmm)





Sie werden die Details der Baum-Welch-Methode verstehen, indem Sie die einschlägige Literatur lesen und Ihr Gehirn auf eine Statistik abstimmen. Prozesse.





Ich wünsche Ihnen viel Erfolg und eine gute Karriere im Bankgeschäft mit IT-Strukturen!








All Articles