banner
Nachrichtenzentrum
Ansprechendes Design

Vorhersage der Korrosionshemmungseffizienz kleiner organischer Moleküle anhand von Daten

Jul 06, 2023

npj Materials Degradation Band 7, Artikelnummer: 64 (2023) Diesen Artikel zitieren

286 Zugriffe

Details zu den Metriken

Die Auswahl wirksamer Korrosionsinhibitoren aus dem riesigen chemischen Spektrum ist keine triviale Aufgabe, da es im Grunde unendlich viele gibt. Glücklicherweise haben Techniken des maschinellen Lernens großes Potenzial bei der Erstellung von Auswahllisten von Inhibitorkandidaten vor groß angelegten experimentellen Tests gezeigt. In dieser Arbeit verwendeten wir die Korrosionsreaktionen von 58 kleinen organischen Molekülen auf der Magnesiumlegierung AZ91 und verwendeten molekulare Deskriptoren, die aus ihren Geometrie- und Dichtefunktionaltheorie-Berechnungen abgeleitet wurden, um ihre molekularen Informationen zu kodieren. Statistische Methoden wurden angewendet, um die relevantesten Merkmale für die Zieleigenschaft für Support-Vektor-Regressions- bzw. Kernel-Ridge-Regressionsmodelle auszuwählen und so das Verhalten ungetesteter Verbindungen vorherzusagen. Die Leistung der beiden überwachten Lernansätze wurde verglichen und die Robustheit der datengesteuerten Modelle durch experimentelle Blindtests bewertet.

Magnesium (Mg), das leichteste Strukturmetall, ist aufgrund seiner hervorragenden mechanischen Eigenschaften ein vielversprechendes Material im Automobil- und Luftfahrtbau sowie aufgrund seiner Biokompatibilität in der Medizinindustrie1,2,3. Allerdings müssen Materialien auf Mg-Basis vor Korrosion geschützt werden, um ihre Anwendung in fortschrittlichen technischen Anwendungen zu erleichtern, da Mg ein hochreaktives Metall ist. Oberflächenbeschichtungen stellen eine zuverlässige und wirksame Strategie zur Realisierung des Korrosionsschutzes von Mg dar, indem sie eine Barriereschicht zwischen dem Substrat und der Betriebsumgebung hinzufügen3,4,5. Allerdings können Kratzer oder Risse in der Schutzschicht zu schweren lokalen Korrosionsreaktionen führen6. Dies kann durch den Einbau von Korrosionsinhibitoren in die Beschichtungen gemildert werden, die bei Bedarf freigesetzt werden und die Korrosion in den beschädigten Bereichen verhindern6,7,8. Es ist zu beachten, dass die direkte Einbettung von Korrosionsinhibitoren in eine Beschichtungsmatrix9 deren Funktionalität beeinträchtigen kann, da keine oder nur eine begrenzte Freisetzung erfolgt10,11 oder alle Korrosionsinhibitoren auf einmal unkontrolliert freigesetzt werden können, sobald ein Defekt auftritt12. Die Anwendung von geschichteten Doppelhydroxiden (LDHs) mit interkalierten Korrosionsinhibitoren ist einer der vielversprechenden Wege, um einen kontrollierbaren aktiven Korrosionsschutz zu erreichen12,13,14. Ein LDH ist ein anorganischer, schichtförmiger Ton mit einer Brucitstruktur in seiner reinen Mg(OH)2-Form. Dank der Anionenaustauscheigenschaft der LDH-Struktur können die Korrosionsinhibitoren in diese Schichtstruktur eingelagert und anschließend durch Austausch mit einer aggressiven korrosiven Spezies (z. B. Chlorid) freigesetzt werden, um Korrosionsreaktionen zu unterdrücken12. Neben den anorganischen Korrosionsinhibitoren, die häufig in LDHs eingelagert sind, wie Vanadat12, Wolframat15 und Molybdat16, haben organische Korrosionsinhibitoren in letzter Zeit immer mehr Aufmerksamkeit erlangt, da eine große Anzahl organischer Verbindungen eine vielversprechende Korrosionshemmung für Mg und seine Legierungen gezeigt hat7. Darüber hinaus wurde gezeigt, dass kleine organische Moleküle in LDHs interkaliert werden können17,18,19.

Rein experimentelle Studien zur Interkalation neuer organischer Moleküle in LDHs können jedoch zeitaufwändig sein, insbesondere wenn man die große Anzahl der zur Auswahl stehenden Kandidatenmoleküle berücksichtigt20. Abgesehen davon kann die Identifizierung eines wirksamen organischen Korrosionsinhibitors, der in LDHs eingelagert wird (siehe Abb. 1), um einen bestimmten Typ einer Mg-Legierung zu schützen, aufgrund der großen Anzahl organischer Verbindungen mit potenziell nützlichen Eigenschaften eine große Herausforderung darstellen21. Glücklicherweise versprechen auf maschinellem Lernen basierende Ansätze, das Screening nützlicher Verbindungen zu erleichtern.

Schematische Darstellung eines geschichteten Doppelhydroxidsystems mit einer Vielzahl organischer Inhibitorkandidaten.

Maschinelles Lernen (ML) hat sich in den letzten Jahren aufgrund der Erweiterung von Algorithmen und technologischen Fortschritten in der Computerhardware rasant entwickelt22. Während sie unser tägliches Leben beeinflussen23,24, haben Algorithmen des maschinellen Lernens auch in der Materialwissenschaft eine wichtige Rolle erlangt25,26. Bei der Materialentdeckung wurden verschiedene Algorithmen angewendet, wie beispielsweise die Vorhersage von Verbindungen27,28,29, die Strukturvorhersage30,31 und die Vorhersage von Materialeigenschaften wie Bandlücke32, Supraleitung33, Volumen- und Schermoduln34 sowie zur Identifizierung wirksamer Korrosionsinhibitoren auf der Grundlage quantitativer Struktur-Eigenschafts-Beziehungen ( QSPRs)35,36. Für Letzteres wurde eine Reihe verschiedener Algorithmen für maschinelles Lernen (z. B. neuronale Netze, Kernel-Ridge-Regression und Zufallswälder)21,37,38 erfolgreich entwickelt, um die korrosionshemmende Wirkung kleiner organischer Verbindungen für verschiedene Arten von Mg und seinen Legierungen vorherzusagen7 ,21,37, Aluminiumlegierungen35,36,39 und Materialien auf Kupferbasis40. Natürlich sind ein ausreichend großer, vielfältiger und zuverlässiger Trainingsdatensatz und ein geeigneter Modellierungsrahmen (in der Regel basierend auf einem oder mehreren maschinellen Lernalgorithmen) zwei der entscheidenden Voraussetzungen für die Entwicklung prädiktiver QSPR-Modelle. Ein dritter wichtiger Schritt ist die Auswahl relevanter Eingabemerkmale, die entweder durch chemische Intuition38 oder auf der Grundlage statistischer Methoden37 ausgewählt werden können. Random Forests (RFs) haben sich aufgrund ihrer Fähigkeit, die Wichtigkeit jedes Features zu berechnen, als nützlicher Algorithmus für den Umgang mit Feature-Auswahlproblemen erwiesen41. Andererseits hat sich gezeigt, dass das Vorhandensein korrelierter Merkmale ihre Fähigkeit zur Identifizierung wichtiger Merkmale beeinträchtigt und möglicherweise ihre Genauigkeit verringert42,43,44. Um dieses Problem anzugehen, wird üblicherweise eine Kombination aus zufälligen Wäldern und rekursiver Merkmalseliminierung (RFE) verwendet43,44 und ihr Potenzial zur Auswahl relevanter Merkmale zur Modellierung der Korrosionshemmungseffizienz (IEs) kleiner organischer Moleküle wurde in einer aktuellen Studie37 nachgewiesen.

In dieser Arbeit wurden Korrosionshemmungsreaktionen von 58 kleinen organischen Molekülen auf der Mg-Legierung AZ91 aus einer früheren Arbeit7 verwendet, um ein QSPR-Modell zu trainieren. AZ91 wurde in dieser Studie als Substrat ausgewählt, da unsere früheren experimentellen Arbeiten45 gezeigt haben, dass LDHs direkt an der Oberfläche dieser Legierung als Konversionsschicht synthetisiert werden können. Die Korrosionshemmungseffizienzen der Proben im verwendeten Datensatz weisen eine höhere Varianz auf als die, die bisher in anderen Mg-Legierungs-Vorhersagemodellen21,37,38 verwendet wurden, was die Verwendung eines maschinellen Lernalgorithmus mit guten Generalisierungsfähigkeiten erforderlich macht. Ein potenzieller Algorithmus, der zur Etablierung des QSPR-Workflows eingesetzt werden kann, sind Support Vector Machines (SVMs), die aufgrund ihrer guten theoretischen Grundlagen und Generalisierungsfähigkeit eine der leistungsstärksten, präzisesten und robustesten Methoden des überwachten Lernens darstellen46,47. Sie wurden in den letzten zwanzig Jahren häufig zur Lösung verschiedener komplexer realer Probleme eingesetzt, beispielsweise zur Bildklassifizierung48, zur Erkennung handschriftlicher Zeichen49 und zur Gesichtserkennung5046. Unter Anwendung des gleichen Prinzips wie SVMs wurde die Support Vector Regression (SVR) entwickelt, um Regressionsprobleme mit hoher Genauigkeit zu lösen51,52,53. SVR52 wurde verwendet, um ein Vorhersagemodell zu entwickeln, um den Einfluss der Außenumgebung auf die Korrosionsraten metallischer Materialien zu untersuchen54,55. Darüber hinaus entwickelten Liu et al.56 ein auf SVR basierendes QSPR-Modell für Q235-Stahl unter Verwendung einer begrenzten Anzahl organischer Verbindungen und zeigten damit, dass SVR für kleine Datensätze gut geeignet ist. Allerdings kann die Verwendung kleiner Trainingsdatensätze zu einer Überanpassung führen und die Validierung der Vorhersage ist ein wesentlicher Bestandteil der Modellentwicklung. Daher wurde in dieser Arbeit SVR für die QSPR-Modellkonstruktion ausgewählt, um seine Anwendbarkeit für Mg-basierte Datensätze zu untersuchen, und die Qualität der Vorhersagen wurde mithilfe experimenteller Blindtests bewertet. Darüber hinaus wurden bereits Ansätze auf Basis der Kernel-Ridge-Regression (KRR)57,58 angewendet, um den Einfluss kleiner organischer Moleküle auf das Korrosionsverhalten von kommerziell reinem Mg21 vorherzusagen. Daher wurde der KRR-Ansatz als Maßstab für den Leistungsvergleich des SVR-Modells gewählt. Im Gegensatz zu bestehenden Modellen36,37,38, bei denen die Anzahl der zum Erstellen des Modells verwendeten ausgewählten Features manuell ausgewählt wurde, wurde in dieser Arbeit eine zweistufige Feature-Auswahlmethode vorgeschlagen, bei der die optimale Anzahl von Features durch das Modell bestimmt wird. Letztendlich kann das in dieser Arbeit entwickelte QSPR-Modell die Auswahl eines wirksamen organischen Korrosionsinhibitors aus einer großen Anzahl organischer Verbindungen unterstützen, dessen Interkalation in die LDHs weiter untersucht wird, um das Ziel des Korrosionsschutzes für AZ91 zu erreichen.

Die Modellkonstruktion in dieser Arbeit basiert auf dem in Abb. 2 dargestellten Arbeitsablauf. Es wurden weitere Untersuchungen zur Merkmalsauswahl durchgeführt, die ein Schlüsselelement bei der Entwicklung eines ML-Modells ist, das die Korrosions-IES kleiner organischer Moleküle vorhersagt. Basierend auf den ausgewählten Merkmalen wurden zwei verschiedene QSPR-Modelle (basierend auf SVR- und KRR-Algorithmen) trainiert, um die IEs kleiner organischer Moleküle auf AZ91 vorherzusagen, und ihre Genauigkeit wurde anschließend anhand experimenteller Blindtests mit zehn Verbindungen, die nicht Teil davon waren, validiert und verglichen des ursprünglichen Datensatzes.

Als Trainingsdatenbank wird eine Datenbank mit 58 kleinen organischen Molekülen und ihren Korrosionsreaktionen auf AZ91 verwendet. Zunächst wird ein Pool molekularer Deskriptoren zur Kodierung ihrer Molekülstruktur generiert und einem zweistufigen Ansatz zur Auswahl spärlicher Merkmale unterzogen. Die relevantesten Deskriptoren werden anschließend verwendet, um überwachte Modelle für maschinelles Lernen zu trainieren, um das Verhalten ungetesteter Chemikalien vorherzusagen. Die Auswahl der kleinen organischen Moleküle für diesen Schritt erfolgt nach unserem zuvor veröffentlichten ExChem21-Ansatz.

Als Eingabemerkmale für die Entwicklung eines QSPR-Modells wurde ein Pool von 2876 unterschiedlichen molekularen Deskriptoren generiert. Nachdem alle molekularen Deskriptoren mit konstanten Werten weggelassen wurden, wurden die verbleibenden 876 einer Merkmalsauswahl unterzogen. Um im ersten Schritt ein 25-Tupel von Features aus den anfänglichen 876 Features auszuwählen, wurde ein RFE-Ansatz auf Basis von Random Forests angewendet. Weitere Details zum Auswahlprozess der ausgewählten 25 Features finden Sie im Abschnitt „Methoden“. Der Feature-Auswahl wurde ein zusätzlicher Schritt hinzugefügt, indem die Anzahl der verwendeten Eingabe-Features schrittweise verringert wurde, beginnend mit den 25-Tupel-Features, die im ersten Schritt mithilfe von RFE ausgewählt wurden (siehe Abschnitt „Feature-Auswahl“ in Abb. 2). Im zweiten Schritt der Merkmalswichtigkeitsuntersuchung wurden die zunächst ausgewählten 25 Merkmale in 24 Schritten nacheinander entfernt. Anstatt RFE anzuwenden, wurden die SVR- und KRR-Modelle direkt verwendet, um Merkmale in jedem Schritt auszuwählen, zusammen mit Hyperparameteroptimierung und Kreuzvalidierungen. Bei jedem Schritt gibt es mehr als eine Möglichkeit, ein Feature aus dem vorherigen Schritt zu entfernen, z. B. gibt es 25 Möglichkeiten, ein Feature aus den ausgewählten 25 Features zu entfernen. Es wurden Versuche über alle Möglichkeiten hinweg durchgeführt und die Möglichkeit mit dem niedrigsten durchschnittlichen quadratischen Mittelfehler (Root Mean Square Error, RMSE) der IEs für die Testsätze in der Kreuzvalidierung wurde bei jedem Schritt ausgewählt und in Abb. 3 dargestellt. Die gemittelten RMSEs für die Zugsätze in der Kreuzvalidierung, die dem Diagramm in Abb. 3 entspricht, sind in der Ergänzungstabelle 1 aufgeführt. Für die ausgewählte Möglichkeit wurde das entfernte Merkmal im vorherigen Schritt als das am wenigsten wichtige Merkmal definiert. Am Ende wurden die ausgewählten 25 Merkmale entsprechend der zuvor definierten Wichtigkeit geordnet, wodurch eine Reihenfolge der Wichtigkeit der Merkmale erhalten wurde.

25-Tupel-Features, die nach der Anwendung von RFE basierend auf zufälligen Wäldern in Schritt 1 ausgewählt wurden, wurden einzeln entfernt und der minimale gemittelte RMSE der Testsätze in den Kreuzvalidierungen variierte mit der Anzahl der Features für SVR (in der schwarzen Linie). ) und KRR (in roter Linie) Modelle.

Der Trend der schwarzen Linie in Abb. 3 zeigt, dass die optimale Anzahl der für das SVR-Modell ausgewählten Features acht beträgt, da das resultierende Modell den niedrigsten RMSE aufweist. Die ausgewählten molekularen Deskriptoren sind P_VSA_LogP_2, Mor28e, HOMO, MATS4v, Mor06s, GATS4p, MATS8m und Mor15v, geordnet nach ihrer vorgeschlagenen Merkmalsbedeutung. Mit Ausnahme des höchsten besetzten Molekülorbitals (HOMO), das aus DFT-Berechnungen erhalten wird, stammen die anderen sieben Merkmale aus drei Deskriptorkategorien (P_VSA-ähnliche Deskriptoren59, 3D-MoRSE-Deskriptoren60 und 2D-Autokorrelationen61), die aus dem Chemoinformatik-Softwarepaket alvaDesc62 erhalten wurden. P_VSA-ähnliche Deskriptoren basieren auf der Van-der-Waals-Oberfläche der Verbindungen, indem sie alle atomaren Beiträge aufsummieren. 3D-MoRSE-Deskriptoren integrieren die gesamten Molekülstrukturinformationen, indem sie die atomaren paarweisen Informationen in Bezug auf den Streuparameter basierend auf der Elektronenbeugung zusammenfassen und dann mit einer der Eigenschaften gewichtet werden, z. B. Masse, Sanderson-Elektronegativität, Van-der-Waals-Volumen und atomare Polarisierbarkeit. Die 2D-Autokorrelationsdeskriptoren werden berechnet, um die gegenseitige Abhängigkeit zwischen atomaren Eigenschaften (analog zu den 3D-MoRSE-Deskriptoren) bereitzustellen, die durch eine Protokollfunktion63 verbunden sind. Alle diese drei Deskriptorkategorien konzentrieren sich auf die Berechnung der räumlichen Verteilung einer generischen molekularen Eigenschaft und nicht nur auf die Berücksichtigung der Atomkonfigurationen.

Im KRR-Modell ergab die optimale Anzahl von Merkmalen elf, wie in Abb. 3 dargestellt. Die elf ausgewählten Merkmale wurden als Mor15v, HOMO, MATS8m, Mor30e, nRNH2, C-018, GATS4p, MATS2i, Mor11e, Mor06s, Mor28e identifiziert , geordnet nach ihrer Merkmalsbedeutung. Bemerkenswert ist, dass sechs der elf Features mit denen des SVR-Modells identisch sind. Die überlappenden Features sind Mor15v, HOMO, MATS8m, GATS4p, Mor06s, Mor28e. Dieser Befund impliziert, dass die aus DFT-Berechnungen, 3D-MoRSE-Deskriptoren und 2D-Autokorrelationsdeskriptoren abgeleiteten HOMO-Energien offenbar entscheidende Strukturinformationen zur Vorhersage der Korrosionshemmungseffizienz kleiner organischer Moleküle für AZ91 kodieren. Diese Beobachtung stimmt gut mit der Schlussfolgerung von Schiessler et al.37 überein, in der DFT-berechnete Merkmale sowie 3D-MoRSE-Deskriptoren als wichtige Eingabemerkmale für ein künstliches neuronales Netzwerk identifiziert wurden, das IEs kleiner organischer Moleküle für die Mg-basierte Legierung ZE41 als verwendet Zieleigenschaft.

Abgesehen von diesen drei Merkmalsgruppen wurden für die wichtigsten elf Merkmale im KRR-Modell eine Reihe von Merkmalen identifiziert, die die Anzahl der funktionellen Gruppen und atomzentrierten Fragmente kodieren, z. B. nRNH2, das direkt die Anzahl der aliphatischen primären Amine kodiert. Alle fünf Verbindungen, die in unserem Datensatz nRNH2-Einheiten enthalten, sind Aminosäuren (Cystein, Glutaminsäure, Glycin, DL-Norleucin und DL-Phenylalanin), die negative Hemmwirkungen aufweisen. Dieser Befund stimmt gut mit der Schlussfolgerung in Lit. überein. 7, dass Aminosäuren die Korrosion von Mg-Legierungen beschleunigten. Das Korrosionsbeschleunigungsverhalten von Aminosäuren kann auf die Löslichkeit ihres entsprechenden Magnesiumkomplexes in Wasser zurückgeführt werden64,65. Das Merkmal C-018 aus der Klasse der atomzentrierten Fragmente stellt =CHX dar, wobei „=“ eine Doppelbindung und X eines der folgenden Heteroatome darstellt: O, N, S, P, Se oder ein beliebiges Halogen. Im =CHX-Fragment ist ein sp2-hybridisiertes Kohlenstoffatom direkt mit einem Wasserstoff und einem der als X bezeichneten Heteroatome verbunden. In unserem Trainingsdatensatz ist diese spezifische funktionelle Gruppe in den Verbindungen Kojisäure, Maltol und Uracil vorhanden ( X steht entweder für O oder N, wohingegen alle drei organischen Moleküle negative IE-Werte aufweisen, wie in der ergänzenden Abbildung 1 dargestellt. Es wurde nachgewiesen, dass die von diesen drei Verbindungen mit Magnesium gebildeten Komplexe wasserlöslich sind65,66,67. Im Vergleich zur Fähigkeit, mit Metallionen Komplexe zu bilden, scheint die Löslichkeit dieser Komplexe in Wasser ein entscheidenderer Faktor für die Wirksamkeit der organischen Inhibitoren zu sein. Diese Beobachtung stimmt gut mit der Arbeit von Lamaka et al.7 und Anjum et al.19 überein, dass organische Verbindungen, deren Komplexe eine geringe Wasserlöslichkeit aufweisen, eine hohe hemmende Wirkung zeigten, da sie die Korrosion durch die Bildung einer schützenden Barriereschicht verzögern.

Einige der mit dem Chemoinformatik-Tool erhaltenen molekularen Deskriptoren sind geheimnisvoll und können nicht einfach mit physikalischen Eigenschaften verknüpft werden, da sie aus umfangreichen mathematischen Manipulationen der chemischen Struktur abgeleitet werden. Pearson-Tests lieferten ein besseres Verständnis der Korrelation zwischen den verwendeten Eingabemerkmalen und IEs sowie ein Maß für deren statistische Signifikanz. Der Pearson-Korrelationskoeffizient misst die lineare Beziehung zwischen zwei Datensätzen, die zwischen –1 und 1 variiert, wobei 0 keine Korrelation impliziert, während –1 und 1 exakte negative bzw. positive Korrelationen implizieren68. Für beide Modelle ist die Korrelation zwischen den einzelnen Merkmalen und den IEs moderat bis schwach, da die Werte der ermittelten Korrelationskoeffizienten in Abb. 4a, b nicht höher/niedriger als ±0,5 sind, wobei die stärksten negativen und positiven Korrelationen − betragen 0,5 bzw. 0,2. Diese Beobachtung stimmt gut mit den Erkenntnissen von Guyon et al.69 überein, dass die ausgewählten Merkmale für sich genommen nicht unbedingt die relevantesten in Bezug auf die Zieleigenschaft sind. Für die Korrelation zwischen den ausgewählten Merkmalen wird keine der Korrelationen als starke Beziehung (>0,9) betrachtet und die meisten Korrelationen (über 90 %) werden entsprechend als schwache Beziehungen (0,1 − 0,39) interpretiert oder sind vernachlässigbar (<0,1). zu den Definitionen in der Arbeit von Schober et al.68. Darüber hinaus wurde der p-Wert zwischen den verwendeten Eingabemerkmalen und IEs berechnet und in der ergänzenden Abbildung 2 dargestellt, wobei der p-Wert ein indikatives Maß dafür ist, ob die Korrelation statistisch signifikant ist. Die schwachen Korrelationen zwischen den meisten ausgewählten Merkmalen stellen weitgehend sicher, dass kein redundantes Merkmal als Eingabe für die Modelle ausgewählt wird. Obwohl die meisten der ausgewählten Merkmale nur schwach mit der Zieleigenschaft selbst korrelieren, deuten die Ergebnisse darauf hin, dass sie aufgrund der zugrunde liegenden Synergieeffekte dennoch zur Erstellung eines Vorhersagemodells verwendet werden können, wenn sie als Gruppe verwendet werden, was in guter Übereinstimmung mit früheren Arbeiten ist37,38 .

eine Pearson-Korrelation zwischen den ausgewählten 8-Tupel-Merkmalen für das SVR-Modell und IEs. b Pearson-Korrelation zwischen den ausgewählten 11-Tupel-Merkmalen für das KRR-Modell und IEs.

Zusammenfassend lässt sich sagen, dass die in dieser Arbeit vorgeschlagene Methode zur Merkmalsauswahl in der Lage ist, die Genauigkeit der Vorhersagen in der Kreuzvalidierungsphase zu erhöhen, indem die schrittweise Reduzierung auf die Gruppe von Merkmalen angewendet wird, die im ersten Schritt basierend auf RFE ausgewählt wurde. Darüber hinaus kann die vorgeschlagene Methode verwendet werden, um RFE für SVR mit einem RBF-Kernel (Radial Basis Function) durchzuführen, da derzeit in scikit-learn70 nur der lineare Kernel unterstützt wird. Ein weiterer Vorteil dieser vorgeschlagenen Methode besteht darin, dass keine Voraussetzung für die Anzahl der auszuwählenden Merkmale besteht, sodass alle möglichen Kombinationen von Merkmalsgruppen bei der Merkmalsauswahl untersucht werden und eine umfassende Untersuchung gewährleistet werden kann.

Hyperparameter für die SVR- und KRR-Modelle wurden in einer Rastersuche mit 5-facher Kreuzvalidierung zusammen mit der Untersuchung der Merkmalswichtigkeit optimiert. Als Ergebnis wurde der Satz von Hyperparametern für den SVR (random_state=10, C = 17, γ = 0,1) und den KRR (random_state = 10, α = 0,1, γ = 0,1) ausgewählt. Für beide Modelle ist der für den Zufallszustandsparameter (random_state) ausgewählte Wert identisch, was auf die gleiche Aufteilung des Datensatzes in Zug- und Testsätze in den Kreuzvalidierungen hinweist. Nach der Auswahl der Hyperparameter wurde der vollständige Anfangsdatensatz verwendet, um die beiden Modelle anzupassen. Anschließend wurden diese Modelle angewendet, um das Verhalten der Blindtestverbindungen vorherzusagen und deren Robustheit zu bewerten. Die experimentellen und vorhergesagten Werte für die 10 Verbindungen in den Blindtests sind in Tabelle 1 aufgeführt. Die vorhergesagten Werte für die Piperazinderivate 1 und 2 sind für beide Modelle braun markiert, da ihre vorhergesagten Beschleunigungseffizienzen deutlich weniger negativ sind als die entsprechenden experimentellen Werte , die außerhalb des Hemmwirkungsbereichs der in dieser Arbeit als Ausgangsdatensatz verwendeten Chemikalien liegen. Es ist jedoch bemerkenswert, dass korrekt vorhergesagt wurde, dass beide Verbindungen die Auflösung von AZ91 beschleunigen. Diese beiden Verbindungen wurden in der folgenden Analyse ausgeschlossen, da sie außerhalb des Anwendungsbereichs des verwendeten Ausgangsdatensatzes liegen.

Die SVR- und KRR-Modelle schnitten für den gesamten Anfangsdatensatz, die blauen Punkte in Abb. 5a, b, ähnlich gut ab, wo die vorhergesagten und experimentellen Werte gut mit einem RMSE von etwa 10 % korrelierten. Die Leistung einiger der Blindtestverbindungen, die unter- oder überschätzt wurden (in Abb. 5 durch rote und blaue gestrichelte Kreise oder Ellipsen eingekreist), führt zu einem relativ hohen RMSE-Wert für beide verwendeten Modelle (84 % für SVR und 69 % für KRR). Darüber hinaus gibt es keine starke positive Korrelation zwischen den vorhergesagten und experimentellen Werten für die acht Verbindungen (3-10) sowohl für den SVR (Koeffizient = −0,571, p-Wert = 0,140) als auch für den KRR (Koeffizient = 0,005, p-Wert =). 0,991)-Modelle, da diese statistischen Kennzahlen stark von den Ausreißern beeinflusst werden. Aufgrund der relativ großen Abweichung zwischen vorhergesagten und experimentellen Werten für die acht Verbindungen wurde für Verbindungen mit experimentell ermittelten Werten im Bereich von -30 %

Die Korrelation zwischen den vorhergesagten Werten und den gemessenen Werten aus Experimenten (IEs in %) wird für (a) SVR-Modell und (b) KRR-Modell angezeigt. Die blauen Punkte stellen den vollständigen Ausgangsdatensatz dar (58 Verbindungen, die Namen und IEs wurden in der Ergänzungstabelle 2 aufgeführt). Die orangefarbenen Punkte stellen die Blindtestverbindungen dar. Bitte beachten Sie, dass 1-Acetylpiperazin (1) und 1-Amino-4-methylpiperazin (2) aus der Darstellung ausgeschlossen wurden. Obwohl ihre Schätzungen qualitativ korrekt waren (1: IEpred,SVR = -172 %, IEpred,KRR = −108 %, IE\({}_{\exp }\) = −563 %; 2: IEpred,SVR = −195 %, IEpred,KRR = −109%, IE\({}_{\exp }=\) −517%), ihre gemessenen Werte lagen weit außerhalb des Modellbereichs. Die entsprechenden Strukturen der aufgetragenen Blindtestverbindungen sind unten in der Abbildung dargestellt. Rote und blaue gestrichelte Kreise oder Ellipsen markieren die über- bzw. unterschätzten Verbindungen.

Darüber hinaus verursachen Modulatoren, die ein aliphatisches primäres Amin (nRNH2), z. B. in einer Aminosäure, oder Fragmente mit der allgemeinen Formel R=CHX aufweisen, in experimentellen Studien erhöhte Korrosionsraten7. Die Ergebnisse deuten darauf hin, dass kleine organische Moleküle, die eine der oben genannten funktionellen Einheiten aufweisen, höchstwahrscheinlich von der Suche nach wirksamen Korrosionsinhibitoren ausgeschlossen werden können. Sie könnten jedoch vorteilhafte Eigenschaften für andere Anwendungen haben, beispielsweise als Batterieelektrolytadditive, bei denen eine kontrollierte Auflösung des Mg-basierten Anodenmaterials erforderlich ist71. Eine der 10 Verbindungen (5-Nitrouracil (6)) im Blindtestsatz enthielt ein =CHX-Fragment, was darauf hindeutet, dass sie einen negativen IE-Wert aufweist. Im Gegensatz zur vorhergesagten negativen Hemmungseffizienz zeigte das experimentelle Ergebnis jedoch, dass 5-Nitrouracil eine ausreichende Hemmungsleistung erbrachte. Dies könnte auf die Nitroverbindungen von 5-Nitrouracil zurückgeführt werden, die nachweislich den Korrosionsschutz einer Vielzahl von Legierungen unterstützen72,73,74. Darüber hinaus hat Uracil zwar einen negativen IE-Wert (-151 %), seine Substitution durch eine Nitro-Einheit, 5-Nitrouracil, führt zu einem hochwirksamen Korrosionsinhibitor (78 %), was darauf hindeutet, dass die Nitro-Einheit eine wichtige Rolle beim Korrosionsschutz spielt . Diese Beobachtung wird jedoch von keinem der verwendeten Modelle erfasst, da in unserem Datensatz nur begrenzte Informationen über die Wirkung einer Nitrofunktionalität vorliegen, da es nur zwei Verbindungen gibt (5-Nitrobarbitursäure und 3-Methyl-2-nitrobenzoesäure). die diese funktionelle Einheit aufweisen. Dies weist stark darauf hin, dass künftige experimentelle Datensätze mehr Verbindungen mit einer Nitroeinheit umfassen müssen, damit das Modell den Einfluss dieser Gruppe auf die korrosionshemmende Wirkung wiedererlangen kann.

Um mehr Erkenntnisse über die Verbindungen zu gewinnen, bei denen es sich um Ausreißer handelt, wurden die paarweisen Abstände basierend auf den Eingabemerkmalen zwischen den Verbindungen im Blindtest und dem ursprünglichen Datensatz berechnet, der bei der Erstellung der Modelle zur Bewertung der sehr ähnlichen Strukturen für jede Blindtestverbindung verwendet wurde. Ein Wert von 1 in der Ähnlichkeitsmatrix deutet auf eine hohe Ähnlichkeit hin, während ein Wert von 0 auf keine Ähnlichkeit hinweist. Abbildung 6a, b zeigen die Ähnlichkeitsmatrix für die acht Blindtestverbindungen und den anfänglichen Datensatz für die SVR- bzw. KRR-Modelle. Die fünf wichtigsten ähnlichen Strukturen (mit den Namen und den Hemmwirkungen) für 5-Nitrouracil (6) sind in Abb. 6 für beide Modelle dargestellt. Für diese 5 Strukturen in SVR (Uracil, Glycin, 5-Nitrobarbitursäure, DL-Phenylalanin, Glutaminsäure) und KRR (Uracil, Maltol, Kojisäure, Fumarsäure, Harnstoff) kann eine Ähnlichkeitsreihenfolge von hoch nach niedrig extrahiert werden. Es ist bemerkenswert, dass es offensichtliche Ähnlichkeitsunterschiede für einige der Top-5-ähnlichen Strukturen gibt, wie zum Beispiel den Unterschied zwischen Uracil und Harnstoff im KRR-Modell, wie in Abb. 6b dargestellt. Dies weist auf die Beschränkung des in dieser Arbeit verwendeten Datensatzes hin, da es insgesamt nur 58 Datenpunkte gibt. Infolgedessen gibt es im Datensatz nicht genügend Strukturen mit höherer oder vergleichbarer Ähnlichkeit zur Ähnlichkeit zwischen Uracil und der Blindtestverbindung 5-Nitrouracil (6). Die IEs dieser fünf ähnlichen Strukturen sind in Tabelle 2 nach Ähnlichkeit geordnet. Derselbe Prozess wurde angewendet, um die fünf am häufigsten vorkommenden ähnlichen Strukturen zu extrahieren und ihre IEs für alle anderen Ausreißer in Tabelle 2 aufzulisten. Natürlich wird der vorhergesagte Wert für jeden Ausreißer stark von den IEs der fünf ähnlichsten Strukturen beeinflusst. Da beispielsweise die IEs der fünf am häufigsten vorkommenden ähnlichen Strukturen für Verbindung 3 im SVR-Modell alle positiv sind, ist auch der vom Modell vorhergesagte IE-Wert positiv. Dies weist darauf hin, dass unsere Modelle in der Lage sind, die im Datensatz vorhandenen Ähnlichkeitsverbindungen zu erfassen und entsprechende Vorhersagen zu treffen. Die Ähnlichkeitsbeziehungen sind jedoch durch die geringe Größe unseres Datensatzes begrenzt, was zum Auftreten dieser Ausreißer führt. Die Lernkurven für die SVR- und KRR-Modelle (wie in der ergänzenden Abbildung 3 dargestellt) zeigen, dass die gemittelten RMSEs für die Testsätze in der Kreuzvalidierung mit zunehmender Größe des Trainingssatzes abnehmen, obwohl die gemittelten RMSEs der Testsätze sind bei beiden Modellen im Vergleich zu den Zuggarnituren höher. Eine mögliche Abhilfe besteht darin, den Datensatz zu erweitern, sodass die gemittelten RMSEs der Testsätze durch Hinzufügen zusätzlicher Trainingsdaten kontinuierlich sinken können.

Ähnlichkeitsmatrix der 8 Blindtestverbindungen und der 58 Verbindungen im Datensatz für das (a) SVR-Modell und (b) KRR-Modell. Als Beispiel sind in der Abbildung die Top 5 ähnlicher Strukturen mit den Namen und den Hemmwirkungen für 5-Nitrouracil (6) dargestellt. Die Werte unter den Namen sind die Ähnlichkeitswerte. Die Farbskala entspricht den Werten in der Matrix, wobei Dunkelblau geringe/keine, Grün mäßige und Gelb hohe Ähnlichkeitswerte anzeigt.

In dieser Arbeit wurde die Leistung zweier überwachter maschineller Lernansätze (SVR und KRR) hinsichtlich ihrer Robustheit bei der Vorhersage der Korrosionshemmung kleiner organischer Verbindungen für AZ91 bewertet. Die Blindtests für die Modelle wurden durchgeführt, um die Zuverlässigkeit jedes Modells zu beurteilen. Da der Datensatz in Zukunft immer größer und vielfältiger wird, können Ähnlichkeitsverbindungen verbessert werden, um den Anwendungsbereich des Modells zu erweitern. Jeder der beschriebenen Modellansätze kann dann angewendet werden, um das Korrosionshemmungsverhalten einer großen Menge organischer Verbindungen mit größerer Sicherheit vorherzusagen und vielversprechende Inhibitoren für AZ91 auszuwählen, wodurch die Materialkosten und die Umweltauswirkungen von Experimenten erheblich gesenkt werden und gleichzeitig die Entdeckung wirksamer Korrosion beschleunigt wird Inhibitoren.

Zusammenfassend lässt sich sagen, dass kleine organische Moleküle ein großes Potenzial zur Steuerung des Korrosionsverhaltens von Materialien auf Magnesiumbasis aufweisen. Die Auswahl wirksamer organischer Korrosionsinhibitoren aus der riesigen Menge verfügbarer Verbindungen ist keine triviale Aufgabe und kann nicht allein durch zeit- und ressourcenaufwändige experimentelle Untersuchungen gelöst werden. QSPR-Modelle, die auf überwachten Lerntechniken wie SVR und KRR basieren, sorgen für eine große Effizienz beim Screening nach wirksamen Mitteln für den Korrosionsschutz.

In dieser Arbeit wurde der RBF-Kernel verwendet, um zwei prädiktive datengesteuerte Modelle zu entwickeln, die auf den verfügbaren experimentellen IEs organischer Verbindungen für AZ91 aus einer früheren Arbeit7 basieren. Ein Pool von 876 Eingabemerkmalen, die aus dem Cheminformatik-Softwarepaket und DFT abgeleitet wurden, wurde generiert und einer ersten Merkmalsauswahl auf Basis von RFE unterzogen, um die Merkmalsgruppe bestehend aus 25 Merkmalen mit der höchsten Relevanz für die Zieleigenschaft zu identifizieren. Diese 25 Merkmale wurden anschließend schrittweise reduziert, um die optimale Anzahl von Merkmalen für die jeweilige Methode zu finden. Die Ergebnisse zeigen, dass der niedrigste RMSE für 8 Merkmale im SVR-Ansatz und für 11 Merkmale im KRR-Ansatz erzielt wird. Es gibt eine erhebliche Überschneidung zwischen den beiden Gruppen ausgewählter Merkmale, da die Energieniveaus des HOMO, die aus DFT, 3D-MoRSE-Deskriptoren und 2D-Autokorrelationsdeskriptoren abgeleitet wurden, für beide Fälle im endgültigen Modell landeten, was gut mit den Ergebnissen in unserem übereinstimmt vorherige Arbeit37.

Um die Leistung der beiden in dieser Arbeit untersuchten Modellrahmen zu bewerten, wurden Blindtests durchgeführt. Von den zehn Verbindungen in den Blindtests wurden 1-Acetylpiperazin (1) und 1-Amino-4-methylpiperazin (2) von beiden Modellen korrekt als starke Beschleuniger mit IE-Werten negativer als –100 % vorhergesagt. Allerdings lagen die experimentell ermittelten Werte weit außerhalb des Trainings-IE-Bereichs und daher wurden ihre vorhergesagten Werte stark unterschätzt. Für die anderen acht Verbindungen, 2-Hydroxyphenylessigsäure, 3-Methylpyrazol, Tartronsäure und Pyromellithsäure, wurden beide Modelle korrekt vorhergesagt, wobei die vom SVR-Modell vorhergesagten Werte im Vergleich zum KRR-Modell näher an den tatsächlichen Werten liegen. Darüber hinaus identifizierten beide Modelle 5-Nitrouracil und Trimethylolpropan als Ausreißer, obwohl es für das SVR-Modell zwei weitere Ausreißer gibt. Für jeden Ausreißer gibt es eine deutliche Variation für die IEs der fünf höchst ähnlichen Strukturen, die aus dem Datensatz extrahiert wurden, was letztendlich zu einer falschen Vorhersage des IE-Werts führen kann. Dies weist darauf hin, dass der Ähnlichkeitszusammenhang der Strukturen durch die verfügbaren Daten begrenzt ist.

Zusammenfassend lässt sich sagen, dass die in diesem Artikel vorgeschlagene zweistufige Methode zur Merkmalsauswahl die relevantesten Merkmale auswählen und gleichzeitig die Vorhersagegenauigkeit der SVR- und KRR-basierten QSPR-Modelle verbessern kann. Nachdem der Pool der verfügbaren Features zunächst mithilfe von RFE auf ein 25-Tupel reduziert wurde, wird dieser Feature-Satz anschließend systematisch auf das beste n-Tupel überprüft, um das Vorhersagemodell zu trainieren, anstatt sich bei der Auswahl der Anzahl und Zusammensetzung der Eingabefeatures auf die menschliche Intuition zu verlassen . Trotz des begrenzten Trainingsdatensatzes sagte das SVR-basierte Modell robuste Schätzungen für die Korrosionsschutzleistung von vier und das KRR-basierte Modell von sechs Mitgliedern des Blindtestsatzes voraus, während die SVR-Vorhersagen näher an den experimentellen Ergebnissen lagen als das KRR-Modell lässt sich besser verallgemeinern, was zu weniger erkannten Ausreißern führt. Ausreißer hingegen sind nicht immer eine schlechte Sache, da sie Hinweise darauf geben, welche strukturellen Leitmotive als nächstes getestet werden sollten, um den Anwendungsbereich und die Robustheit der Modelle zu erhöhen. Unseren Ergebnissen zufolge führt die Substitution des Uracil-Stammsystems durch eine Nitroeinheit (5-Nitrouracil (6)) zu einem hochwirksamen Korrosionsinhibitor (IE = 78 %) im Vergleich zu Uracil (IE = −151 %). Unser Modell ist jedoch nicht in der Lage, das Verhalten dieser Verbindung korrekt vorherzusagen, und dieses strukturelle Leitmotiv sollte daher das Ziel künftiger Experimente sein, um den Anwendungsbereich unseres Modells zu erweitern. Die neuen Datenpunkte werden anschließend zur Erweiterung der Trainingsdatenbank und damit zur Verbesserung der Genauigkeit der Vorhersagen für einen größeren Bereich des chemischen Raums verwendet. Die Einspeisung weiterer Trainingsproben in das Modell erleichtert eine aktive Versuchsplanung und beschleunigt so die Auswahl wirksamer Inhibitoren für AZ91 und andere Materialien. Diese Arbeit zeigt, dass datengesteuerte Modelle, die auf SVR- und KRR-Ansätzen basieren, nicht nur eine zuverlässige Grundlage für die Generierung von Vorhersagemodellen bieten und dass sie auch zur Vorhersage der Korrosionshemmungseffizienz kleiner organischer Moleküle für Mg-basierte Materialien eingesetzt werden können. Anschließend werden die ausgewählten Inhibitoren auf ihre Einlagerung in LDH untersucht, um einen aktiven Korrosionsschutz von AZ91 zu erreichen. Schließlich können die in dieser Arbeit entwickelten, auf maschinellem Lernen basierenden Strategien auch angepasst werden, um quantitative Struktur-Eigenschafts-Beziehungen in verschiedenen Anwendungsfeldern zu untersuchen, sofern ausreichend Trainingsdaten zum Trainieren der jeweiligen Modelle verfügbar sind.

Aus der Arbeit von Lamaka et al.7 wurden 58 organische Verbindungen für AZ91 extrahiert und in dieser Arbeit als Datenbank verwendet. Diese 58 organischen Verbindungen wurden auf der Grundlage der folgenden drei Anforderungen ausgewählt: Die Konzentration des getesteten Inhibitors betrug 0,05 M in einer pH-neutralen wässrigen Lösung mit 0,5 Gew.-% Natriumchloridelektrolyt (NaCl), das Molekulargewicht (<350 Da) und die Inhibitionseffizienz reichten von −250 % bis 100 %. Die Konzentration wurde auf 0,05 M gewählt, da die meisten organischen Verbindungen in dieser Konzentration für AZ91 gemessen wurden und andere Konzentrationen die Hemmwirkung einer chemischen Verbindung beeinflussten7. Der chemische Raum wurde in einem begrenzten Molekulargewichtsbereich erforscht, da wir an der Suche nach kleinen molekularen organischen Inhibitoren interessiert sind. Die Auswahl des Inhibitionseffizienzbereichs ist ein Gleichgewicht zwischen der großen Anzahl von Verbindungen, die für die Erstellung eines Modells von Vorteil ist, und dem kleinen Bereich seitens der Beschleuniger, da die Erforschung starker Beschleuniger in dieser Arbeit kein Interesse hat.

Nach der Datenextraktion wurden die Molekülstrukturen dieser 58 Verbindungen in den DFT-Rechnungen auf der Theorieebene TPSSh/def2SVP unter Verwendung des quantenchemischen Softwarepakets Gaussian 1675 aufgebaut und optimiert. DFT-berechnete Merkmale, insbesondere die am höchsten besetzten (HOMO) und Es wurde gezeigt, dass das niedrigste unbesetzte Molekülorbital (LUMO) mit der Korrosionshemmungseffizienz kleiner organischer Moleküle für einige Materialien auf Mg-Basis korreliert38,76,77. Die optimierten Strukturen aus DFT wurden anschließend als Eingabe im Cheminformatik-Softwarepaket alvaDesc 1.0.2262 verwendet, um weitere Features zu generieren, die dann mit den HOMO- und LUMO-Features zum ursprünglichen Feature-Set kombiniert wurden. Für jede Verbindung gibt es im anfänglichen Merkmalssatz über 800 Merkmale, was die Anzahl der Verbindungen im ursprünglichen Datensatz deutlich übersteigt. Zunächst wurde RFE auf Basis von Random Forests angewendet, um die 25-Tupel-Features auszuwählen, wodurch zunächst der Feature-Raum reduziert wurde. Diese ausgewählten 25 Merkmale können aufgrund der zufälligen Initialisierung in den Zufallswäldern unterschiedlich sein, wenn der Auswahlvorgang wiederholt wird. Das Auswahlverfahren wurde 50 Mal wiederholt und ergab 50 verschiedene Gruppen ausgewählter Top-25-Features. Diese 50 unterschiedlichen Merkmalsgruppen, die in Schritt 1 erhalten wurden, werden in die 5-fache Kreuzvalidierung (wie in der ergänzenden Abbildung 4 dargestellt) des SVR-Modells eingespeist. Die Merkmalsgruppe mit dem niedrigsten gemittelten Test-RMSE der Kreuzvalidierung im SVR-Modell wurde aus den 50 Merkmalsgruppen ausgewählt und ist die Grundlage für die Suche nach den relevantesten Merkmalen für das SVR- bzw. KRR-Modell. Die 25 Features wurden schrittweise reduziert (ein Feature pro Schritt), um unbedeutende Features aus dem Modelltraining zu entfernen. In jedem Schritt gibt es mehr als eine Möglichkeit, eines der gesamten Features zu entfernen, und alle Möglichkeiten wurden untersucht. Bei jedem Schritt wurde die Option ausgewählt, die den niedrigsten gemittelten Test-RMSE ergab, und die erhaltenen Merkmale wurden für den nächsten Schritt verwendet. Die Anzahl der berücksichtigten Merkmale lag zwischen 25 und 1. Bei Anwendung dieser Methode wurden jeweils die relevantesten Merkmale ausgewählt, die den niedrigsten gemittelten Test-RMSE für die SVR- und KRR-Modelle erzielten. Nach der Auswahl der optimalen Merkmale für jedes Modell führte das fortgesetzte schrittweise Vorgehen zu einer Reihenfolge der Wichtigkeit der ausgewählten Merkmale in Abhängigkeit von ihrer Entfernungsreihenfolge.

Die Ansätze SVR52,78 und KRR58 wurden ausgewählt, um die QSPR-Modelle für die Vorhersage der Inhibitionseffizienz kleiner organischer Verbindungen für die AZ91-Legierung mit Hilfe eines RBF-Kernels zu erstellen. Eine Kernelfunktion kann die nichtlinearen Verteilungsdaten im Eingaberaum auf einen höherdimensionalen Raum abbilden, in dem die Regression in linearer Form erfolgen kann. Der RBF-Kernel wurde in dieser Arbeit ausgewählt, da er der am weitesten verbreitete Kernel in SVM ist79 und Smola et al.80 wiesen darauf hin, dass der RBF-Kernel im Allgemeinen eine vernünftige Wahl für Datensätze mit wenigen Informationen über ihre Form ist. Nach der Anwendung des gleichen Merkmalsauswahlprozesses auf jedes Modell wurden die relevantesten Merkmale ermittelt. In dieser Arbeit setzt sich der hochdimensionale Eingabevektor aus den zuvor identifizierten relevantesten Merkmalen zusammen und die Zielwerte sind die experimentelle Hemmungseffizienz, die aus der Arbeit von Lamaka et al.7 extrahiert wurde. Die Regression wird durch ε-SVR und KRR erreicht, und die mit diesen beiden Methoden erzielten Ergebnisse werden in dieser Arbeit verglichen und diskutiert. Der Unterschied zwischen diesen beiden Methoden besteht in ihren Fehlerverlustfunktionen. Während KRR einen quadratischen Fehlerverlust anwendet, verwendet SVR einen ε-unempfindlichen Verlust, wie in der ergänzenden Abbildung 5 dargestellt. Hyperparameter wie γ des RBF-Kernels (wie in der ergänzenden Abbildung 6 zu sehen), der Regularisierungsparameter C, verwalten Der Kompromiss zwischen der Glätte und Überanpassung des ε-SVR und der Regularisierungsparameter α für eine ähnliche Kompromissfunktion im KRR-Modell werden in einer 5-fachen Rastersuche abgestimmt, um optimale Werte in Bezug auf das Ziel zu finden Eigentum. Mit Ausnahme dieser drei genannten Parameter wurde auch der Zufallszustandsparameter (random_state), der die Aufteilung der Zug- und Testsätze steuert, in der 5-fach-Gittersuche optimiert, um die voreingenommene Aufteilung aufgrund des relativ kleinen Datensatzes (58 Verbindungen) zu vermeiden Großer Hemmwirkungsgradbereich (von –250 % bis 100 %). Die Verteilung der Hemmwirkungsgrade ist in der ergänzenden Abbildung 7 dargestellt.

Die in dieser Arbeit verwendete Ähnlichkeitsberechnung basiert auf einer Distanzmetrik, bei der die ausgewählten Eingabemerkmale die Koordinaten jeder Verbindung im entsprechenden hochdimensionalen Merkmalsraum sind. Der im SVR- und KRR-Modell verwendete RBF-Kernel wurde bei der Ähnlichkeitsberechnung angewendet, die wie folgt definiert ist

Dabei sind x und y jeweils die Vektoren der ausgewählten Eingabemerkmale für zwei Verbindungen.

Der zur Erstellung der SVR- und KRR-Modelle verwendete Datensatz wurde aus der Arbeit von Lamaka et al.7 extrahiert und daher wurde die Validierung für diese beiden Modelle (Blindtests) mit demselben Versuchsaufbau und unter denselben Bedingungen durchgeführt. Für die Auswahl der Verbindungen in den Blindtests wurden Trimesinsäure und Pyromellitsäure von Experimentatoren auf der Grundlage chemischer Intuition vorgeschlagen, während die übrigen Kandidaten nach dem in einer früheren Arbeit21 beschriebenen ExChem-Ansatz ausgewählt wurden, wobei eine Datenbank mit 7094 im Handel erhältlichen Verbindungen verwendet wurde bereitgestellt von Thermo Fisher Scientific. Der IE von Verbindungen wurde auf der Grundlage eines Wasserstoffentwicklungstests berechnet, bei dem die Menge an freigesetztem Wasserstoff aufgrund der Korrosion von Magnesium beim Eintauchen in eine NaCl-Lösung gemessen wird. 0,5 g AZ91 Mg-Chips mit einer Oberfläche von 430 ± 29 cm2/g aus derselben Charge, die in der Arbeit von Lamaka et al. verwendet wurde. wurde in 0,5 Gew.-%ige NaCl-Lösung ohne (Referenzlösung) und mit den ungetesteten Verbindungen getaucht. Die chemische Zusammensetzung der AZ91-Chips ist identisch mit der Arbeit von Lamaka et al. und ist in der Ergänzungstabelle 3 angegeben. Die Konzentration der Verbindungen betrug 0,05 M und der pH-Wert der Lösungen wurde mit NaOH/HCl auf 7 ± 0,1 eingestellt. Die Messungen der Wasserstoffentwicklung wurden für jede Lösung dreimal wiederholt und der Durchschnitt der berechneten IEs wurde für den entsprechenden Blindtest-Datenpunkt verwendet. Der IE wurde durch die folgende Gleichung definiert

wobei \({V\,}_{{{{{\rm{H}}}}}_{2}}^{0}\) und \({V\,}_{{{{{\rm {H}}}}}_{2}}^{{{{\rm{Inh}}}}}\) sind die H2-Volumina, die nach 20-stündigem Eintauchen in die Referenz-NaCl-Lösung und die NaCl-Lösung, die das enthält, entwickelt werden untersuchte chemische Verbindung bzw. Weitere Einzelheiten zu den Wasserstoffentwicklungstests finden Sie in der Originalveröffentlichung7.

Die Autoren erklären, dass die Primärdaten, die die Ergebnisse dieser Studie stützen, in der Arbeit und ihren Zusatzinformationen zu finden sind. Die in dieser Studie verwendeten Daten sind unter https://doi.org/10.5281/zenodo.8135985 verfügbar.

Der für diese Studie verwendete Code ist unter https://doi.org/10.5281/zenodo.8135985 verfügbar.

Tan, J. & Ramakrishna, S. Anwendungen von Magnesium und seinen Legierungen: eine Übersicht. Appl. Wissenschaft. 11, 6861 (2021).

Artikel CAS Google Scholar

Landkof, B. Magnesiumlegierungen und ihre Anwendungen, p. 168–172 (John Wiley & Sons, Inc, 2000).

Luan, B., Yang, D., Liu, X. & Song, G.-L. Korrosion von Magnesiumlegierungen, S. 541–564 (Elsevier, 2011).

Chen, X.-B., Easton, M., Birbilis, N., Yang, H.-Y. & Abbott, T. Corrosion Prevention Of Magnesium Alloys 282–312 (Woodhead Publishing Limited, 2013).

Pommiers, S., Frayret, J., Castetbon, A. & Potin-Gautier, M. Alternative Konversionsbeschichtungen zu Chromat zum Schutz von Magnesiumlegierungen. Corros. Wissenschaft. 84, 135–146 (2014).

Artikel CAS Google Scholar

Zhang, G. et al. Korrosionsschutzeigenschaften verschiedener Inhibitoren, die eine PEO/LDHS-Verbundbeschichtung auf der Magnesiumlegierung AZ31 enthalten. Wissenschaft. Rep. 11, 1–14 (2021).

Google Scholar

Lamaka, S. et al. Umfassendes Screening von mg-Korrosionsinhibitoren. Corros. Wissenschaft. 128, 224–240 (2017).

Artikel CAS Google Scholar

Hu, H., Nie, X. & Ma, Y. Magnesiumlegierungen – Eigenschaften in festen und flüssigen Zuständen 67–108 (IntechOpen, 2014).

Latnikova, A. Polymerkapseln für selbstheilende Korrosionsschutzbeschichtungen. Ph.D. Dissertation (Universität Potsdam, 2012).

Denissen, PJ, Shkirskiy, V., Volovitch, P. & Garcia, SJ Korrosionshemmung an geritzten Stellen in beschichtetem aa2024-t3 durch Cer- und dmtd-beladene natürliche Siliziumdioxid-Mikropartikel unter kontinuierlichem Eintauchen und zyklischer Nass-/Trockeneinwirkung. ACS-Appl. Mater. Schnittstellen 12, 23417–23431 (2020).

Artikel CAS Google Scholar

Yin, Y., Prabhakar, M., Ebbinghaus, P., da Silva, CC & Rohwerder, M. Neutrale Inhibitormoleküle, eingeschlossen im Polypyrrol-Netzwerk zum Korrosionsschutz. Chem. Ing. J. 440, 135739 (2022).

Artikel CAS Google Scholar

Zheludkevich, M. et al. Aktive Schutzbeschichtungen mit geschichteten Doppelhydroxid-Nanocontainern aus Korrosionsinhibitor. Corros. Wissenschaft. 52, 602–611 (2010).

Artikel CAS Google Scholar

Zhang, X. et al. Aktiver Korrosionsschutz von mg-al-schichtigem Doppelhydroxid für Magnesiumlegierungen: ein kurzer Überblick. Beschichtungen 11, 1316 (2021).

Artikel CAS Google Scholar

Jing, C., Dong, B., Raza, A., Zhang, T. & Zhang, Y. Korrosionshemmung von geschichteten Doppelhydroxiden für metallbasierte Systeme. Nano Mater. Wissenschaft. 3, 47–67 (2021).

Artikel CAS Google Scholar

Li, D. et al. Organische Korrosionsschutzbeschichtung mit geschichtetem Doppelhydroxid, beladen mit Korrosionsinhibitor aus Wolframat. Prog. Org. Mantel. 71, 302–309 (2011).

Artikel CAS Google Scholar

Yu, X. et al. Einstufige Synthese von lamellarem Molybdat-Säulenhydrotalcit und seine Anwendung zum Schutz von Az31-mg-Legierungen. Festkörperwissenschaft. 11, 376–381 (2009).

Artikel CAS Google Scholar

Poznyak, S. et al. Neuartige anorganische Wirtsschicht-Doppelhydroxide mit interkalierten organischen Gastinhibitoren für Korrosionsschutzanwendungen. ACS-Appl. Mater. Schnittstellen 1, 2353–2362 (2009).

Artikel CAS Google Scholar

Zhang, F. et al. Korrosionsbeständigkeit superhydrophober geschichteter Doppelhydroxidfilme auf Aluminium. Angew. Chem. 120, 2500–2503 (2008).

Artikel Google Scholar

Anjum, MJ et al. Grüne Korrosionsinhibitoren interkalierten mg:Al-beschichtete Doppelhydroxidbeschichtungen zum Schutz der mg-Legierung. Rare Metals 40, 2254–2265 (2021).

Artikel CAS Google Scholar

Tabish, M. et al. Überprüfung des aktuellen Status geschichteter, auf Doppelhydroxid basierender intelligenter Nanocontainer für korrosionshemmende Anwendungen. J. Mater. Res. Technol. 10, 390–421 (2021).

Artikel CAS Google Scholar

Würger, T. et al. Erforschung der Struktur-Eigenschafts-Beziehungen in Magnesium-Auflösungsmodulatoren. npj Mater. Degrad. 5, 1–10 (2021).

Artikel Google Scholar

Schmidt, J., Marques, MR, Botti, S. & Marques, MA Aktuelle Fortschritte und Anwendungen des maschinellen Lernens in der Festkörpermaterialwissenschaft. npj-Berechnung. Mater. 5, 1–36 (2019).

Artikel Google Scholar

Popel, M. et al. Maschinelle Übersetzung transformiert: Ein Deep-Learning-System erreicht eine Nachrichtenübersetzungsqualität, die mit der von menschlichen Profis vergleichbar ist. Nat. Komm. 11, 1–15 (2020).

Artikel Google Scholar

Sharma, S., Bhatt, M. & Sharma, P. Gesichtserkennungssystem mit maschinellem Lernalgorithmus. Im Jahr 2020 5. Internationale Konferenz über Kommunikations- und Elektroniksysteme (ICCES), 1162–1168 (IEEE, 2020).

Gormley, AJ & Webb, MA Maschinelles Lernen in der kombinatorischen Polymerchemie. Nat. Rev. Mater. 6, 642–644 (2021).

Artikel CAS Google Scholar

Hart, GL, Mueller, T., Toher, C. & Curtarolo, S. Maschinelles Lernen für Legierungen. Nat. Rev. Mater. 6, 730–755 (2021).

Artikel Google Scholar

Faber, FA, Lindmaa, A., Von Lilienfeld, OA & Armiento, R. Maschinelle Lernenergien von 2 Millionen Elpasolith-Kristallen (abc 2 d 6). Physik. Rev. Lett. 117, 135502 (2016).

Artikel Google Scholar

Schmidt, J., Chen, L., Botti, S. & Marques, MA Vorhersage der Stabilität ternärer intermetallischer Verbindungen mit Dichtefunktionaltheorie und maschinellem Lernen. J. Chem. Physik. 148, 241728 (2018).

Artikel Google Scholar

Kim, K. et al. Durch maschinelles Lernen beschleunigtes Hochdurchsatz-Materialscreening: Entdeckung neuartiger quartärer Heusler-Verbindungen. Physik. Rev. Mater. 2, 123801 (2018).

Artikel CAS Google Scholar

Graser, J., Kauwe, SK & Sparks, TD Maschinelles Lernen und Energieminimierungsansätze für Kristallstrukturvorhersagen: ein Rückblick und neue Horizonte. Chem. Mater. 30, 3601–3612 (2018).

Artikel CAS Google Scholar

Oliynyk, AO, Adutwum, LA, Harynuk, JJ & Mar, A. Klassifizierung von Kristallstrukturen binärer Verbindungen durch Auswahl von Clusterauflösungsmerkmalen und Support-Vektor-Maschinenanalyse. Chem. Mater. 28, 6672–6681 (2016).

Artikel CAS Google Scholar

Zhuo, Y., Mansouri Tehrani, A. & Brgoch, J. Vorhersage der Bandlücken anorganischer Feststoffe durch maschinelles Lernen. J. Phys. Chem. Lette. 9, 1668–1673 (2018).

Artikel CAS Google Scholar

Isayev, O. et al. Materialkartographie: Darstellung und Abbau des Materialraums mithilfe struktureller und elektronischer Fingerabdrücke. Chem. Mater. 27, 735–743 (2015).

Artikel CAS Google Scholar

De Jong, M. et al. Ein statistischer Lernrahmen für die Materialwissenschaften: Anwendung auf Elastizitätsmodule k-närer anorganischer polykristalliner Verbindungen. Wissenschaft. Rep. 6, 1–11 (2016).

Google Scholar

Winkler, DA et al. Verwendung von experimentellen Hochdurchsatzdaten und In-silico-Modellen zur Entdeckung von Alternativen zu toxischen Chromat-Korrosionsinhibitoren. Corros. Wissenschaft. 106, 229–235 (2016).

Artikel CAS Google Scholar

Galvão, TL, Novell-Leruth, G., Kuznetsova, A., Tedim, J. & Gomes, JR Aufklärung von Struktur-Eigenschafts-Beziehungen in Korrosionsinhibitoren aus Aluminiumlegierungen durch maschinelles Lernen. J. Phys. Chem. C 124, 5624–5635 (2020).

Artikel Google Scholar

Schiessler, EJ et al. Vorhersage der Hemmwirkung von Magnesiumauflösungsmodulatoren mithilfe spärlicher Modelle für maschinelles Lernen. npj-Berechnung. Mater. 7, 1–9 (2021).

Artikel Google Scholar

Feiler, C. et al. In-silico-Screening von Modulatoren der Magnesiumauflösung. Corros. Wissenschaft. 163, 108245 (2020).

Artikel CAS Google Scholar

White, PA et al. Auf dem Weg zur Materialentdeckung: Tests zum Screening und zur Untersuchung chemischer Wechselwirkungen neuartiger Korrosionsinhibitoren in Lösungen und Beschichtungen. Neue J. Chem. 44, 7647–7658 (2020).

Artikel CAS Google Scholar

Kokalj, A. Molekulare Modellierung organischer Korrosionsinhibitoren: Berechnungen, Fallstricke und Konzeptualisierung der Molekül-Oberflächen-Bindung. Corros. Wissenschaft. 193, 109650 (2021).

Artikel CAS Google Scholar

Chen, R., Dewi, C., Huang, S. & Caraka, R. Auswahl kritischer Funktionen für die Datenklassifizierung basierend auf Methoden des maschinellen Lernens. J. Big Data 7, 1–26 (2020).

Kubus, M. et al. Das Problem redundanter Variablen in Zufallswäldern. Acta Univ. Donau. Oecon. 6, 7–16 (2018).

Google Scholar

Darst, BF, Malecki, KC & Engelman, CD Verwendung der rekursiven Merkmalseliminierung in einer Zufallsstruktur, um korrelierte Variablen in hochdimensionalen Daten zu berücksichtigen. BMC Genet. 19, 1–6 (2018).

Artikel Google Scholar

Biau, G. & Scornet, E. Eine zufällige Waldführung. Test 25, 197–227 (2016).

Artikel Google Scholar

Shulha, T. et al. In-situ-Bildung von LDH-basierten Nanocontainern auf der Oberfläche einer Az91-Magnesiumlegierung und detaillierte Untersuchung ihrer Kristallstruktur. J. Magnes. Legierung. (2021).

Thurnhofer-Hemsi, K., Lopez-Rubio, E., Molina-Cabello, MA & Najarian, K. Radiale Basisfunktionskernoptimierung für Support-Vektor-Maschinenklassifikatoren. Vorabdruck unter https://archiv.org/pdf/2007.08233.pdf (2020).

Cervantes, J., Garcia-Lamont, F., Rodríguez-Mazahua, L. & Lopez, A. Eine umfassende Umfrage zur Klassifizierung von Support-Vektor-Maschinen: Anwendungen, Herausforderungen und Trends. Neurocomputing 408, 189–215 (2020).

Artikel Google Scholar

Kaur, P., Pannu, HS & Malhi, AK Erkennung von Pflanzenkrankheiten mithilfe von Zernike-Momenten gebrochener Ordnung und SVM-Klassifikator. Neuronal. Berechnen. Appl. 31, 8749–8768 (2019).

Artikel Google Scholar

Bhowmik, TK, Ghanty, P., Roy, A. & Parui, SK SVM-basierte hierarchische Architekturen für die Erkennung handschriftlicher Bangla-Zeichen. Int. J. Doc. Anal. Erkenne. 12, 97–108 (2009).

Artikel Google Scholar

Je, H.-M., Kim, D. & Bang, SY Erkennung menschlicher Gesichter in digitalen Videos mithilfe von svmensemble. Neuronaler Prozess. Lette. 17, 239–252 (2003).

Artikel Google Scholar

Awad, M. & Khanna, R. Effiziente Lernmaschinen, p. 67–80 (Springer, 2015).

Okujeni, A. et al. Ein Vergleich fortgeschrittener Regressionsalgorithmen zur Quantifizierung der städtischen Landbedeckung. Remote Sens. 6, 6324–6346 (2014).

Artikel Google Scholar

Wehbe, B., Hildebrandt, M. & Kirchner, F. Experimentelle Evaluierung verschiedener maschineller Lernregressionsmethoden zur Modellidentifizierung autonomer Unterwasserfahrzeuge. Im Jahr 2017 IEEE International Conference on Robotics and Automation (ICRA), 4885–4890 (IEEE, 2017).

Fang, S., Wang, M., Qi, W. & Zheng, F. Hybride genetische Algorithmen und Unterstützungsvektorregression bei der Vorhersage der atmosphärischen Korrosion metallischer Materialien. Berechnen. Mater. Wissenschaft. 44, 647–655 (2008).

Artikel CAS Google Scholar

Zhi, Y., Fu, D., Zhang, D., Yang, T. & Li, X. Vorhersage und Wissensgewinnung über atmosphärische Korrosionsraten von niedriglegierten Stählen im Freien basierend auf dem Random-Forest-Ansatz. Metalle 9, 383 (2019).

Artikel Google Scholar

Liu, Y. et al. Ein auf maschinellem Lernen basierendes qsar-Modell für Benzimidazol-Derivate als Korrosionsinhibitoren durch Einbeziehung einer umfassenden Merkmalsauswahl. Interdisziplinär. Wissenschaft. Berechnen. Lebenswissenschaft. 11, 738–747 (2019).

Artikel CAS Google Scholar

Schölkopf, B., Luo, Z. & Vovk, V.Empirical Inference: Festschrift In Honor Of Vladimir N. Vapnik (Springer Science & Business Media, 2013).

Murphy, KP Maschinelles Lernen: Eine probabilistische Perspektive (MIT Press, 2012).

Labute, P. Ein weit verbreiteter Satz von Deskriptoren. J. Mol. Graph. 18, 464–477 (2000).

Artikel CAS Google Scholar

Devinyak, O., Havrylyuk, D. & Lesyk, R. 3D-Morse-Deskriptoren erklärt. J. Mol. Graph. 54, 194–203 (2014).

Artikel CAS Google Scholar

Hollas, B. Eine Analyse des Autokorrelationsdeskriptors für Moleküle. J. Mathe. Chem. 33, 91–101 (2003).

Artikel CAS Google Scholar

Mauri, A. alvadesc: ein Tool zur Berechnung und Analyse molekularer Deskriptoren und Fingerabdrücke. In Ecotoxicological QSARs, 801–820 (Springer, 2020).

Caballero, J. Computermodellierung zur Erklärung, warum 5,5-Diarylpentadienamide trpv1-Antagonisten sind. Molecules 26, 1765 (2021).

Artikel CAS Google Scholar

Reid, B., Agri-Minerals, PE & Headquarters, C. Nop-Petition zur Aufnahme von Magnesiumoxid in die nationale Liste der zulässigen Stoffe. Zelle 850, 261–0807 (2013).

Google Scholar

Case, DR, Zubieta, J., Gonzalez, R. & Doyle, RP Synthese und chemische und biologische Bewertung eines Glycin-Tripeptid-Chelats von Magnesium. Molecules 26, 2419 (2021).

Artikel CAS Google Scholar

Murakami, Y. Komplexierungsverhalten von Kojisäure mit Metallionen. ich. mg (ii) und mn (ii) Chelate. Stier. Chem. Soc. Jpn 35, 52–56 (1962).

Artikel CAS Google Scholar

Kufelnicki, A. Komplexe von Uracil (2, 4-Dihydroxypyrimidin)-Derivaten. Teil I. Cu (ii), Ca (ii) und mg (ii) Koordination mit Uracil und verwandten Verbindungen in wässriger Lösung. Pol. J. Chem. 76, 1559–1570 (2002).

CAS Google Scholar

Schober, P., Boer, C. & Schwarte, LA Korrelationskoeffizienten: angemessene Verwendung und Interpretation. Anästhesie. Analg. 126, 1763–1768 (2018).

Artikel Google Scholar

Guyon, I., Weston, J., Barnhill, S. & Vapnik, V. Genauswahl zur Krebsklassifizierung mithilfe von Support-Vektor-Maschinen. Mach. Lernen. 46, 389–422 (2002).

Artikel Google Scholar

Pedregosa, F. et al. Scikit-learn: Maschinelles Lernen in Python. J. Mach. Lernen. Res. 12, 2825–2830 (2011).

Google Scholar

Würger, T. et al. Datengesteuerte Auswahl von Elektrolytzusätzen für wässrige Magnesiumbatterien. J. Mater. Chem. A 10, 21672–21682 (2022).

Deyab, M. Korrosionshemmung von Wärmetauscherrohrmaterial (Titan) in MSF-Entsalzungsanlagen in saurer Reinigungslösung unter Verwendung aromatischer Nitroverbindungen. Entsalzung 439, 73–79 (2018).

Artikel CAS Google Scholar

Aslam, J. et al. Hemmende Wirkung von 2-Nitroacridon auf die Korrosion von kohlenstoffarmem Stahl in 1 m HCl-Lösung: Ein experimenteller und theoretischer Ansatz. J. Mater. Res. Technol. 9, 4061–4075 (2020).

Artikel CAS Google Scholar

Eddy, NO, Ameh, PO & Essien, NB Experimentelle und computergestützte Chemiestudien zur Hemmung von Aluminium und Weichstahl in 0,1 m Hcl durch 3-Nitrobenzoesäure. J. Taibah Univ. Wissenschaft. 12, 545–556 (2018).

Artikel Google Scholar

Frisch, M. et al. Gaussian 16 Revision c. 01, 2016. Gaussian Inc. Wallingford CT1 (2016).

Ju, H., Kai, Z.-P. & Li, Y. Aminische stickstoffhaltige mehrzähnige Schiff-Base-Verbindungen als Korrosionsinhibitoren für Eisen in sauren Medien: eine quantenchemische Berechnung. Corros. Wissenschaft. 50, 865–871 (2008).

Artikel CAS Google Scholar

Barouni, K. et al. Aminosäuren als Korrosionsinhibitoren für Kupfer in Salpetersäure: Experimentelle und theoretische Untersuchung. J. Mater. Umgebung. Sci 5, 456–463 (2014).

CAS Google Scholar

Chang, C.-C. & Lin, C.-J. Libsvm: eine Bibliothek für Support-Vektor-Maschinen. ACM Trans. Intel. Syst. 2, 1–27 (2011).

Artikel Google Scholar

Shi, H., Xiao, H., Zhou, J., Li, N. & Zhou, H. Radialer Basisfunktions-Kernelparameter-Optimierungsalgorithmus in einer Support-Vektor-Maschine basierend auf segmentierter Dichotomie. Im Jahr 2018 5. Internationale Konferenz für Systeme und Informatik (ICSAI), 383–388 (IEEE, 2018).

Smola, AJ & Schölkopf, B. Ein Tutorial zur Support-Vektor-Regression. Stat. Berechnen. 14, 199–222 (2004).

Artikel Google Scholar

Referenzen herunterladen

Wir danken dem Helmholtz-Zentrum Hereon I2B-Projekt MUFfin für die Finanzierung. Die Autoren danken Thermo Fisher Scientific für die Bereitstellung einer chemischen Datenbank, die für die Blindtestauswahl verwendet wurde.

Open-Access-Förderung ermöglicht und organisiert durch Projekt DEAL.

Institut für Oberflächenwissenschaften, Helmholtz-Zentrum Hereon, Geesthacht, Deutschland

Xuejiao Li, Bahram Vaghefinazari, Tim Würger, Sviatlana V. Lamaka, Mikhail L. Zheludkevich und Christian Feiler

Institut für Polymere und Verbundwerkstoffe, Technische Universität Hamburg, Hamburg, Deutschland

Tim Würger

Institut für Materialwissenschaft, Fakultät für Ingenieurwissenschaften, Christian-Albrechts-Universität zu Kiel, Deutschland

Michail L. Scheludkewitsch

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

XL, BV, TW, SVL, MLZ und CF: trugen zur Konzeption und Gestaltung der Studie bei. BV und SVL: bereitgestellte experimentelle Daten. XL, TW und CF: haben die beiden Modelle für maschinelles Lernen erstellt. XL und CF: haben den ersten Entwurf des Manuskripts geschrieben. Alle Autoren haben zur Überarbeitung des Manuskripts beigetragen, die eingereichte Version gelesen und genehmigt.

Korrespondenz mit Xuejiao Li oder Christian Feiler.

Die Autoren geben an, dass keine Interessenkonflikte bestehen.

Anmerkung des Herausgebers Springer Nature bleibt hinsichtlich der Zuständigkeitsansprüche in veröffentlichten Karten und institutionellen Zugehörigkeiten neutral.

Open Access Dieser Artikel ist unter einer Creative Commons Attribution 4.0 International License lizenziert, die die Nutzung, Weitergabe, Anpassung, Verbreitung und Reproduktion in jedem Medium oder Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle angemessen angeben. Geben Sie einen Link zur Creative Commons-Lizenz an und geben Sie an, ob Änderungen vorgenommen wurden. Die Bilder oder anderes Material Dritter in diesem Artikel sind in der Creative Commons-Lizenz des Artikels enthalten, sofern in der Quellenangabe für das Material nichts anderes angegeben ist. Wenn Material nicht in der Creative-Commons-Lizenz des Artikels enthalten ist und Ihre beabsichtigte Nutzung nicht gesetzlich zulässig ist oder über die zulässige Nutzung hinausgeht, müssen Sie die Genehmigung direkt vom Urheberrechtsinhaber einholen. Um eine Kopie dieser Lizenz anzuzeigen, besuchen Sie http://creativecommons.org/licenses/by/4.0/.

Nachdrucke und Genehmigungen

Li, X., Vaghefinazari, B., Würger, T. et al. Vorhersage der Korrosionshemmungseffizienz kleiner organischer Moleküle mithilfe datengesteuerter Techniken. npj Mater Degrad 7, 64 (2023). https://doi.org/10.1038/s41529-023-00384-z

Zitat herunterladen

Eingegangen: 16. Dezember 2022

Angenommen: 28. Juli 2023

Veröffentlicht: 09. August 2023

DOI: https://doi.org/10.1038/s41529-023-00384-z

Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:

Leider ist für diesen Artikel derzeit kein Link zum Teilen verfügbar.

Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt