EinfĂŒhrung oder von welcher KI spreche ich?
Ich interessiere mich hauptsĂ€chlich fĂŒr die universelle KI als Maschine zur Erreichung komplexer Ziele. Das heiĂt, eine Art Hardware- und Softwarekomplex, der gesagt werden kann: Machen Sie ein Flugzeug, das 100 US-Dollar kostet, fliegen Sie 1000 Kilometer mit einer Geschwindigkeit von 800 km / h und befördern Sie 5 Personen. Oder so: Heilen Sie diese und jene Person im Endstadium von Krebs.
KI sollte in der Lage sein, solche Aufgaben zu bewĂ€ltigen, wenn dies physisch ĂŒberhaupt möglich ist. Und wenn es unmöglich ist, dann erzielen Sie das Ergebnis, das dem gegebenen so nahe wie möglich kommt.
Im Moment sehe ich zwei Möglichkeiten, wie man eine universelle KI erhÀlt.
Der erste Weg sind Systeme wie das verstÀrkte Lernen. Sie verbinden sich mit den Sensoren und Aktoren eines Roboters und haben auch ein Belohnungssignal. Das Reinforcement Learning (im Folgenden: RL) erhÀlt im Durchschnitt so viele Belohnungen wie möglich. Und der Belohnungskanal ist der primÀre Weg, um AI zu sagen, was wir davon wollen.
- , GPT-3, . . - , . , ⊠GPT-3 â - â - . â - â - , . â ?â GPT-3 , . GPT-3 .
Reinforcement Learning
.
- , RL , , , .
- . , .
,
, RL . - , 224224, , - . , , , , , . , - , , , - , , , . .
. :
1) , . , . ~1000-2000 . , , .
2) . - , â â, . , . , â â, , .
RL , .
RL . . RL - . - .
, RL . . RL , , .
?
-, RL . , , . - . .
- . RL , . , Doom, , , . RL , . RL - - , , . - - , , - , "" "".
, RL : Doom. .
RL , . , , - Exit.
RL , - , , , , , , Exit. , .
, , .
?
RL . . , .
, RL . , - - .
: RL , . , - , - . , RL - .
: , . , - . , RL , Exit. , ââ - - , 5%, . , - , .
. , RL , . , , ⊠: RL , , . , , , , , .
, RL , . . .
, , . - . : . -, . -, , , .
-. - Model-Based . â â - , , . ( , ) . , , -.
- , , ->, (, )-> .
.
. , . . RL , . , , , - . , RL , : , , .
, , , , , .
, , . , - RL.
? RL , , . , , . , - .
, . , , - , , . , - , - .
- - . , , .
- , . . , RL .
: ? , ?
: - , , ⊠, .
: , , . , , , . , , , , 110 - , .
?
, : , , ( ). , ââ ââ.
, , . , , . â , â, - .
â â - , , . . , . , , . , , , . , -, ââ , .
? ?
- . , -, , . , , RL . - , , - .
, . , . , RL ââ - , , . ?
, . , - .
, , GAN. ( , - RL) , , . , . ââ ââ - , , - . .
, RL , - . , .
-
, , . , , , , - , .
, - RL - , . RL, . - - , RL.
RL . ( --) - : , , ⊠, .
, . , , , .
, . , . . - â â, .
, , , , , . , , , - .
, RL . , . , RL - , , . , . .
, , , . , , -, . , . : 1000$ 100$ . ? , , . , . , . , - , - - . , , , . , , RL, , , , RL .
- , ( ) - , . , - , . RL - , . , - RL . , .
, , , . , .
, , .
Ich wollte diesen Artikel als Dialog provozieren. Sicherlich irre ich mich irgendwo und es gibt schlauere Lösungen als die, an die ich gedacht habe. AusfĂŒhrliche Kommentare und interessante Debatten sind daher willkommen!