ChatGPT kann menschliche Smart-Contract-Auditoren noch nicht schlagen: OpenZeppelins Ethernaut-Herausforderungen

Obwohl ChatGPT-4 noch nicht mit menschlichen Zuhörern konkurrieren kann, stellte OpenZeppelin fest, dass es dafür nicht optimiert ist und KI-Modelle für diesen Zweck trainiert hat wäre wahrscheinlich genauer.

ChatGPT kann Vertragszuhörer Clever Humans nicht schlagen Nochmals: OpenZeppelins Ethernaut Challenges“ class= Nachricht Treten Sie uns in den sozialen Netzwerken bei

Während generative künstliche Intelligenz (KI) in der Lage ist, eine Vielzahl von Aufgaben zu erfüllen, ist ChatGPT-4 von OpenAI aktuellen Tests zufolge derzeit nicht in der Lage, intelligente Verträge so effektiv zu prüfen wie menschliche Prüfer.

Um herauszufinden, ob KI-Tools menschliche Prüfer ersetzen können, haben Mariko Wakabayashi und Felix Wegener von der Blockchain-Sicherheitsfirma OpenZeppelin ChatGPT-4 mit der Ethernaut-Sicherheitsherausforderung des Unternehmens verglichen.

Obwohl das KI-Modell die meisten Level bestanden hat, hatte es Probleme mit neuen Levels, die nach der Trainingsdatenfrist im September 2021 eingeführt wurden, da das Plug-in, das die Web-Konnektivität ermöglicht, nicht verfügbar war. Nicht im Test enthalten.

Ethernaut ist ein Kriegsspiel, das in der virtuellen Maschine Ethereum gespielt wird und aus 28 intelligenten Verträgen – oder Levels – besteht, die es zu hacken gilt. Mit anderen Worten: Level werden abgeschlossen, sobald der richtige Erfolg gefunden wurde.

Laut Tests des OpenZeppelin AI-Teams konnte ChatGPT-4 den Exploit finden und 20 von 28 Levels bestehen, benötigte jedoch zusätzliche Anweisungen, um einige Level nach der ersten Eingabeaufforderung zu lösen: „Führt den folgenden Trick aus.“ eine Sicherheitslücke enthalten?"

Als Antwort auf Fragen von Cointelegraph wies Wegener darauf hin, dass OpenZeppelin von seinen Zuhörern erwartet, dass sie alle Ethernaut-Level abschließen können, wie es alle kompetenten Autoren können sollten.

Wakabayashi und Wegener kamen zwar zu dem Schluss, dass ChatGPT-4 derzeit nicht in der Lage ist, menschliche Prüfer zu ersetzen, wiesen jedoch darauf hin, dass es dennoch als Werkzeug zur Verbesserung der Effizienz der Prüfung intelligenter Verträge eingesetzt werden kann. .

ChatGPT kann menschliche Smart-Contract-Auditoren noch nicht schlagen: OpenZeppelins Ethernaut-Herausforderungen

Obwohl ChatGPT-4 noch nicht mit menschlichen Zuhörern konkurrieren kann, stellte OpenZeppelin fest, dass es dafür nicht optimiert ist und KI-Modelle für diesen Zweck trainiert hat wäre wahrscheinlich genauer.

ChatGPT kann Vertragszuhörer Clever Humans nicht schlagen Nochmals: OpenZeppelins Ethernaut Challenges“ class= Nachricht Treten Sie uns in den sozialen Netzwerken bei

Während generative künstliche Intelligenz (KI) in der Lage ist, eine Vielzahl von Aufgaben zu erfüllen, ist ChatGPT-4 von OpenAI aktuellen Tests zufolge derzeit nicht in der Lage, intelligente Verträge so effektiv zu prüfen wie menschliche Prüfer.

Um herauszufinden, ob KI-Tools menschliche Prüfer ersetzen können, haben Mariko Wakabayashi und Felix Wegener von der Blockchain-Sicherheitsfirma OpenZeppelin ChatGPT-4 mit der Ethernaut-Sicherheitsherausforderung des Unternehmens verglichen.

Obwohl das KI-Modell die meisten Level bestanden hat, hatte es Probleme mit neuen Levels, die nach der Trainingsdatenfrist im September 2021 eingeführt wurden, da das Plug-in, das die Web-Konnektivität ermöglicht, nicht verfügbar war. Nicht im Test enthalten.

Ethernaut ist ein Kriegsspiel, das in der virtuellen Maschine Ethereum gespielt wird und aus 28 intelligenten Verträgen – oder Levels – besteht, die es zu hacken gilt. Mit anderen Worten: Level werden abgeschlossen, sobald der richtige Erfolg gefunden wurde.

Laut Tests des OpenZeppelin AI-Teams konnte ChatGPT-4 den Exploit finden und 20 von 28 Levels bestehen, benötigte jedoch zusätzliche Anweisungen, um einige Level nach der ersten Eingabeaufforderung zu lösen: „Führt den folgenden Trick aus.“ eine Sicherheitslücke enthalten?"

Als Antwort auf Fragen von Cointelegraph wies Wegener darauf hin, dass OpenZeppelin von seinen Zuhörern erwartet, dass sie alle Ethernaut-Level abschließen können, wie es alle kompetenten Autoren können sollten.

Wakabayashi und Wegener kamen zwar zu dem Schluss, dass ChatGPT-4 derzeit nicht in der Lage ist, menschliche Prüfer zu ersetzen, wiesen jedoch darauf hin, dass es dennoch als Werkzeug zur Verbesserung der Effizienz der Prüfung intelligenter Verträge eingesetzt werden kann. .

What's Your Reaction?

like

dislike

love

funny

angry

sad

wow