Die Lineare Regression wird unter anderem für Machine Learning verwendet und zählt zu den populärsten Modellierungsmethoden. Um lineare Regression erfolgreich zu implementieren, benötigt es verschiedene Schritte. Dazu gehört das Verstehen und Auswählen der Daten, die Auswahl der Parameter und die Validierung des Modells. Dieser Beitrag modelliert eine lineare Regression in Python und geht dabei vor allem auf die Validierung ein. Dabei werden vorgestellt (korrigiertes) R², (R)MSE, MAE, MAPE, AIC und BIC. Modelliert wird die Bewertung von Zerealien und genutzt werden öffentlich zugängliche Daten.
Weiterlesen >>EU unterstützt KMU mit Data-Analytics-Software
Um auch KMU einen leistbaren Zugang zu cloudbasierter Data-Analytics-Software zu ermöglichen, hat die EU das Projekt „Cloudi Facturing“ ins Leben gerufen. Bewerbungen sind bis 30.09. noch möglich.
Weiterlesen >>Künstliche Intelligenz als Chance
„Schau mal, wer da spricht? Sprachliche Zukunftsszenarien mit Künstlicher Intelligenz“ war das Thema des diesjährigen ISPA Internet Summit Austria. Das Thema wurde aus verschiedenen Blickwinkeln betrachtet. Wir raten unseren Kunden, dass es wichtig ist, die Beschränkungen der Künstlichen Intelligenz zu beachten, wie etwa, dass juristische Bots keine Anwälte sind oder medizinische Künstliche Intelligenz keine Ärzte ersetzt und die juristischen Auswirkungen nicht vergessen werden sollten.
Weiterlesen >>Warum funktioniert eigentlich Deep Learning?
Deep Learning in einem Artikel zu behandeln ist beinahe unmöglich. In dem verlinkten Artikel ist dieser Versuch dennoch sehr gut geglückt. Die entscheidende Frage ist: „Warum funktioniert eigentlich Deep Learning?“ Das bleibt natürlich eine offene Frage – Gott sei Dank 😉.
Weiterlesen >>Einsatz und Potenzial neuartiger interaktiver Visualisierungstypen in österreichischen Unternehmen
Perkhofer Lisa und Hofer Peter
Unser letzter Beitrag hat sich mit der Vorstellung und der Bewertung der Usability unterschiedlichen neuartigen interaktiver Visualisierungsformen zur Darstellung von multidimensionalen Daten beschäftigt (Sankey, Sunburst, Parallel Coordinates Plot sowie Polar Coordinates Plot). In diesem Beitrag wird der aktuelle Einsatz dieser und anderer Big Data Visualisierungen in österreichischen Unternehmen genauer unter die Lupe genommen und deren Potenzial für einen Einsatz im Controlling analysiert.
Alexa, wie wird das Wetter heute?
Kann Alexa das nächste Gewitter vorhersagen und uns vor der nächsten globalen Krise retten? Wahrscheinlich nicht, aber Sie sollten sie auf jeden Fall fragen, ob Sie am Samstag Morgen eine Jacke zum Brunch benötigen.
Weiterlesen >>Was machen eigentlich unsere Data Scientists?
Was machen wir eigentlich? Anbei eine gute Übersicht.
Weiterlesen >>Vom Nerd zum coolen Data Scientist: Über Rollenbilder in der IT
Blasse Haut, dicke Brille, Einzelgänger ohne soziale Kompetenz: Nerds. Noch vor wenigen Jahren war dies ein weit verbreitetes Klischee von IT-Spezialisten. Mit dem technologischen Fortschritt haben sich auch die Rollenbilder im IT-Bereich in den vergangenen Jahren gewandelt. Durch die plötzliche Masse an unterschiedlichen Daten (Big Data) in Unternehmen hat sich vor etwa zehn Jahren das Berufsbild des Data Scientists entwickelt.
Die beliebtesten Data Science Tools
Die Ergebnisse der Kaggle-Umfrage unter mehr als 16.000 Data Science Experten vermitteln ein klares Bild hinsichtlich der beliebtesten Data Science Tools.
Python und R sind in diesem Jahr die beliebtesten Data Science Tools und ich denke, dieser Trend wird sich fortsetzen. Vor allem als Standard Analyse Tools haben Python und R einen klaren Stellenwert.
Weiterlesen >>Multitenant – Oracle 12c
Im Zuge des Updates im Juni 2013 auf Oracle 12c wurde eine neue (optionale) Form der Datenbankarchitektur eingeführt. Bei der Multitenant Architektur können mehrere Pluggable Databases (PDBs) in einer mandantenfähigen Container Datenbank betrieben werden.