Web Scrapping mit Python Schulung
Web Scraping ist eine Technik zum Extrahieren von Daten von einer Website und zum Speichern in einer lokalen Datei oder Datenbank.
Dieses Live-Training (vor Ort oder per Fernzugriff) richtet sich an Entwickler, die mithilfe von Python das Crawlen vieler Websites automatisieren möchten, um Daten für die Verarbeitung und Analyse zu extrahieren.
Am Ende dieser Schulung können die Teilnehmer:
- Installieren und konfigurieren Sie Python und alle relevanten Pakete.
- Rufen und analysieren Sie Daten ab, die auf vielen Websites gespeichert sind.
- Verstehen Sie, wie Websites funktionieren und wie ihre HTML strukturiert ist.
- Erstellen Sie Spiders, um das Web in großem Maßstab zu crawlen.
- Verwenden Sie Selenium, um AJAX-basierte Webseiten zu crawlen.
Format des Kurses
- Interaktiver Vortrag und Diskussion.
- Viele Übungen und praktische Anwendungen.
- Praktische Umsetzung in einer Live-Lab-Umgebung.
Anpassungsoptionen für den Kurs
- Dieser Kurs setzt Programmierkenntnisse voraus.
- Um ein individuelles Training für diesen Kurs anzufordern, kontaktieren Sie uns bitte, um eine Vereinbarung zu treffen.
Schulungsübersicht
Einführung
Einrichten der Entwicklungsumgebung
Python Einführung: Datenstrukturen, Bedingungen, Dateiverwaltung usw.
Python Pakete für Web Scraping: Scrapy und BeautifulSoup
Wie eine Website funktioniert
Wie HTML aufgebaut ist
Eine Webanfrage stellen
Scraping einer HTML Seite
Arbeiten mit XPath und CSS
Filtern von Daten mit regulären ExpressIonen
Erstellen eines Webcrawlers
Crawlen von AJAX- und JavaScript-Seiten mit Selenium.
Best Practices für Web Scraping
Fehlerbehebung
Zusammenfassung und Schlussfolgerung
Voraussetzungen
- Programming Erfahrung, vorzugsweise in Python. Wenn Teilnehmer Programmiererfahrung in einer anderen Sprache als Python haben, kann die Schulung um zusätzliche einführende Python-Übungen erweitert werden.
Publikum
- Entwickler
Offene Schulungskurse erfordern mindestens 5 Teilnehmer.
Web Scrapping mit Python Schulung - Buchung
Web Scrapping mit Python Schulung - Anfrage
Web Scrapping mit Python - Beratungsanfrage
Beratungsanfrage
Erfahrungsberichte (1)
Viele verschiedene Beispiele und Themen wurden behandelt, von der grundlegenden Untersuchung bis hin zur Login-Verwaltung und der Verwaltung dynamischer Seiten.
Daniele Tagliaferro - Creditsafe Italia Srl
Kurs - Web Scraping with Python
Maschinelle Übersetzung
Kommende Kurse
Kombinierte Kurse
Skalieren der Datenanalyse mit Python und Dask
14 StundenDiese von einem Trainer geleitete Live-Schulung (online oder vor Ort) richtet sich an Datenwissenschaftler und Softwareingenieure, die Dask mit dem Python-Ökosystem verwenden möchten, um große Datensätze zu erstellen, zu skalieren und zu analysieren.
Am Ende dieser Schulung werden die Teilnehmer in der Lage sein:
- Einrichten der Umgebung, um mit Dask und Python die Verarbeitung von Big Data zu beginnen.
- Erforschen Sie die Funktionen, Bibliotheken, Werkzeuge und APIs, die in Dask verfügbar sind.
- Verstehen Sie, wie Dask die parallele Datenverarbeitung in Python beschleunigt.
- Lernen Sie, wie Sie das Python-Ökosystem (Numpy, SciPy und Pandas) mit Dask skalieren können.
- Optimieren Sie die Dask-Umgebung, um eine hohe Leistung bei der Verarbeitung großer Datenmengen zu erhalten.
Datenanalyse mit Python, Pandas und Numpy
14 StundenDieses von einem Dozenten geleitete Live-Seminar in Schweiz (online oder vor Ort) richtet sich an fortgeschrittene Python-Entwickler und Datenanalysten, die ihre Fähigkeiten in der Datenanalyse und -manipulation mit Pandas und NumPy verbessern möchten.
Am Ende des Trainings werden die Teilnehmer in der Lage sein:
- Eine Entwicklungsumgebung einzurichten, die Python, Pandas und NumPy enthält.
- Eine Datenanalyse-Anwendung mit Pandas und NumPy erstellen.
- Erweiterte Datenaufbereitung, -sortierung und -filterung durchführen.
- Agregationsoperationen durchführen und Zeitreihendaten analysieren.
- Daten mit Matplotlib und anderen Visualisierungsbibliotheken visualisieren.
- Ihren Datenanalyses-Code debuggen und optimieren.
FARM (FastAPI, React und MongoDB) Full-Stack-Entwicklung
14 StundenDieses von einem Dozenten geführte, Live-Training (online oder vor Ort) richtet sich an Entwickler, die das FARM (FastAPI, React und MongoDB)-Stack verwenden möchten, um dynamische, leistungsstarke und skalierbare Webanwendungen zu erstellen.
Am Ende dieses Trainings werden die Teilnehmer in der Lage sein:
- Eine entwicklende Umgebung einzurichten, die FastAPI, React und MongoDB integriert.
- Die wesentlichen Konzepte, Funktionen und Vorteile des FARM-Stacks zu verstehen.
- Zu lernen, wie man REST APIs mit FastAPI erstellt.
- Zu lernen, wie man interaktive Anwendungen mit React gestaltet.
- Anwendungen (Frontend und Backend) mithilfe des FARM-Stacks zu entwickeln, zu testen und zu bereitstellen.
Entwicklung von APIs mit Python und FastAPI
14 StundenDiese von einem Trainer geleitete Live-Schulung (online oder vor Ort) richtet sich an Entwickler, die FastAPI mit Python verwenden möchten, um RESTful APIs einfacher und schneller zu erstellen, zu testen und bereitzustellen.
Am Ende dieser Schulung werden die Teilnehmer in der Lage sein:
- Eine notwendige Entwicklungsumgebung für die Entwicklung von APIs mit Python und FastAPI einzurichten.
- APIs mithilfe der FastAPI-Bibliothek schneller und einfacher zu erstellen.
- Zu lernen, wie man Datenmodelle und Schemas basierend auf Pydantic und OpenAPI erstellt.
- APIs mithilfe von SQLAlchemy mit einer Datenbank zu verbinden.
- Sicherheit und Authentifizierung in APIs mithilfe der FastAPI-Tools zu implementieren.
- Container-Images zu erstellen und Web-APIs auf einem Cloud-Server bereitzustellen.
Maschinelles Lernen mit Python – 2 Tage
14 StundenZiel dieses Kurses ist es, eine grundlegende Kompetenz in der Anwendung Machine Learning Methoden in der Praxis zu bieten. Durch die Verwendung der Programmiersprache und ihrer verschiedenen Bibliotheken und auf der Grundlage einer Vielzahl praktischer Beispiele lehrt dieser Kurs, wie man die wichtigsten Baublöcke von Machine Learning verwendet, wie man Datenmodellierungsentscheidungen macht, die Ergebnisse der Algorithmen interpretiert und die Ergebnisse validiert.
Unser Ziel ist es, Ihnen die Fähigkeiten zu vermitteln, die grundlegendsten Tools aus dem Toolbox vertrauensvoll zu verstehen und zu verwenden und die gemeinsamen Fälle der Anwendungen zu vermeiden.
Maschinelles Lernen mit Python – 4 Tage
28 StundenZiel dieses Kurses ist es, allgemeine Kenntnisse in der Anwendung von maschinellen Lernmethoden in der Praxis zu vermitteln. Durch den Einsatz der Programmiersprache Python und ihrer verschiedenen Bibliotheken und anhand einer Vielzahl von Praxisbeispielen vermittelt dieser Kurs, wie man die wichtigsten Bausteine des maschinellen Lernens nutzt, wie man Datenmodellierungsentscheidungen trifft, die Ausgänge der Algorithmen und Validierung der Ergebnisse.
Unser Ziel ist es, Ihnen die Fähigkeiten zu vermitteln, die grundlegendsten Werkzeuge aus dem Werkzeugkasten Maschinenlerntechnik sicher zu verstehen und zu nutzen und die üblichen Fallstricke von Datenwissenschaften zu vermeiden.
Beschleunigung von Python Pandas Arbeitsabläufen mit Modin
14 StundenDiese von einem Trainer geleitete Live-Schulung in Schweiz (online oder vor Ort) richtet sich an Datenwissenschaftler und Entwickler, die Modin verwenden möchten, um parallele Berechnungen mit Pandas für eine schnellere Datenanalyse zu erstellen und zu implementieren.
Am Ende dieser Schulung werden die Teilnehmer in der Lage sein,:
- die notwendige Umgebung einzurichten, um mit der Entwicklung von Pandas-Workflows in großem Maßstab mit Modin zu beginnen.
- die Funktionen, die Architektur und die Vorteile von Modin zu verstehen.
- Die Unterschiede zwischen Modin, Dask und Ray kennen.
- Schnellere Durchführung von Pandas-Vorgängen mit Modin.
- Implementierung der gesamten Pandas API und Funktionen.
Python für die Natursprachengeneration (NLG)
21 StundenIn diesem von einem Instructor geführten Live-Training in Schweiz lernen die Teilnehmer, wie sie Python verwenden können, um hochwertige natürlichen Sprachtext durch das Aufbauen eines eigenen NLG-Systems von Grund auf zu produzieren. Fallstudien werden ebenfalls untersucht und die relevanten Konzepte werden in Live-Lab-Projekten zur Erstellung von Inhalten angewendet.
Am Ende des Trainings können die Teilnehmer:
- NLG verwenden, um Inhalte für verschiedene Branchen wie Journalismus, Immobilien oder Wettersendungen und Sportberichte automatisch zu generieren.
- Quellinhalt auswählen und organisieren, Sätze planen und ein System für die automatische Generierung von Originalinhalten vorbereiten.
- Die NLG-Pipeline verstehen und an jeder Stufe die richtigen Techniken anwenden.
- Die Architektur eines Natural Language Generation (NLG)-Systems verstehen.
- Die geeignetsten Algorithmen und Modelle zur Analyse und Sortierung implementieren.
- Daten aus öffentlich zugänglichen Quellen sowie aus aufbereiteten Datenbanken holen, um sie als Material für generierten Text zu verwenden.
- Manuelle und mühselige Schreibprozesse durch von Computern generierte und automatisierte Inhaltsentwicklung ersetzen.
Erweiterte maschinelles Lernen mit Python
21 StundenIn diesem von einem Dozenten angeführten, lebendigen Training in Schweiz lernen die Teilnehmer die relevantesten und modernsten maschinellen Lernverfahren in Python kennen, während sie eine Reihe von Demoanwendungen mit Bildern, Musik, Texten und Finanzdaten erstellen.
Am Ende dieses Trainings werden die Teilnehmer in der Lage sein:
- Maschinelles Lernen-Algorithmen und -techniken zur Lösung komplexer Probleme zu implementieren.
- Tiefes Lernen und semi-supervises Lernen auf Anwendungen mit Bildern, Musik, Texten und Finanzdaten anzuwenden.
- Python-Algorithmen bis an ihre Grenzen zu treiben.
- Bibliotheken und Pakete wie NumPy und Theano zu verwenden.
Python: Die Langweiligen Aufgaben Automatisieren
14 StundenDiese von einem Ausbilder geleitete Live-Schulung in Schweiz basiert auf dem beliebten Buch "Automate the Boring Stuff with Python", von Al Sweigart. Es richtet sich an Anfänger und deckt wesentliche Python-Programmierkonzepte durch praktische, praxisnahe Übungen und Diskussionen ab. Der Schwerpunkt liegt darauf, zu lernen, wie man Code schreibt, um die Produktivität im Büro drastisch zu steigern.
Am Ende dieses Kurses werden die Teilnehmer wissen, wie man in Python programmiert und diese neuen Fähigkeiten anwendet:
- Automatisierung von Aufgaben durch das Schreiben einfacher Python-Programme.
- Erstellung von Programmen, die Textmuster mithilfe von "regulären Ausdrücken" erkennen können.
- Programmgesteuerte Erstellung und Aktualisierung von Excel-Tabellenkalkulationen.
- Parsen von PDFs und Word-Dokumenten.
- Durchsuchen von Webseiten und Extrahieren von Informationen aus Online-Quellen.
- Erstellung von Programmen, die E-Mail-Benachrichtigungen versenden.
- Verwendung der Debugging-Tools von Python zur schnellen Fehlerbehebung.
- Programmgesteuerte Steuerung von Maus und Tastatur, um Klicks und Eingaben für Sie auszuführen.
Python-Programmierung für Finanzen
35 StundenPython ist eine Programmiersprache, die in der Finanzbranche große Popularität erlangt hat. Angenommen von den größten Investmentbanken und Hedgefonds, wird es verwendet, um eine breite Palette von Finanzanwendungen aufzubauen, die von Kernhandelsprogrammen bis hin zu Risikomanagementsystemen reichen.
In diesem von Lehrern geleiteten Live-Training lernen die Teilnehmer, wie sie mit Python praktische Anwendungen zur Lösung einer Reihe spezifischer finanzbezogener Probleme entwickeln.
Am Ende dieser Schulung können die Teilnehmer:
- Die Grundlagen der Python-Programmiersprache verstehen
- Die besten Entwicklungstools zum Erstellen von Finanzanwendungen in Python herunterladen, installieren und warten
- Geeignete Python-Pakete und Programmiertechniken auswählen und nutzen, um Finanzdaten aus verschiedenen Quellen (CSV, Excel, Datenbanken, Web usw.) zu organisieren, zu visualisieren und zu analysieren
- Anwendungen entwickeln, die Probleme im Zusammenhang mit Asset Allocation, Risikoanalyse, Investment Performance und mehr lösen
- Eine Python-Anwendung beheben, integrieren, bereitstellen und optimieren
Publikum
- Entwickler
- Analysten
- Quants
Format des Kurses
- Teil Vortrag, Teil Diskussion, Übungen und intensive praktische Anwendung
Hinweis
- Dieses Training zielt darauf ab, Lösungen für einige der Hauptprobleme zu bieten, mit denen Finanzexperten konfrontiert sind. Wenn Sie jedoch ein bestimmtes Thema, Tool oder eine bestimmte Technik haben, die Sie vertiefen oder weiter ausführen möchten, kontaktieren Sie uns bitte, um dies zu vereinbaren.
Erweiterte Python - 4 Tage
28 StundenIn dieser von einem Trainer geleiteten Live-Schulung lernen die Teilnehmer fortgeschrittene Python-Programmiertechniken, einschließlich der Anwendung dieser vielseitigen Sprache zur Lösung von Problemen in Bereichen wie verteilte Anwendungen, Datenanalyse und -visualisierung, UI-Programmierung und Wartungsskripting.
Python Programmierung
28 StundenDieses Kurs ist für Personen gedacht, die die Programmiersprache Python erlernen möchten. Der Schwerpunkt liegt auf der Python-Sprache, den Kernbibliotheken sowie auf der Auswahl der besten und nützlichsten Bibliotheken, die von der Python-Community entwickelt wurden. Python treibt Unternehmen an und wird von Wissenschaftlern auf der ganzen Welt verwendet – es ist eine der beliebtesten Programmiersprachen.
Der Kurs kann mit der neuesten Python-Version 3.x durchgeführt werden, wobei praktische Übungen den vollen Umfang nutzen. Der Kurs kann auf jedem Betriebssystem (einschließlich allen UNIX-Varianten, Linux und Mac OS X sowie Microsoft Windows) angeboten werden.
Die praktischen Übungen machen etwa 70 % der Kursdauer aus, während rund 30 % Demonstrationen und Präsentationen sind. Diskussionen und Fragen können während des gesamten Kurses gestellt werden.
Hinweis: Die Schulung kann auf Wunsch vor dem geplanten Kursdatum an spezifische Anforderungen angepasst werden.
Testautomatisierung mit Selenium und Python
14 StundenSelenium ist ein quelloffener Rahmen für die Automatisierung von Webanwendungstests in verschiedenen Browsern. Mit Selenium 4 sind erweiterte WebDriver-APIs, native relative Locatoren und verbesserte Grid-Unterstützung verfügbar. Python bietet Einfachheit und starke Integration mit Testrahmen wie Pytest, was es zur Entwicklung skalierbarer und wartbarer Testautomatisierungssuiten zu einer leistungsstarken Wahl macht.
Diese vom Trainer geleitete Live-Schulung (online oder vor Ort) richtet sich an Anfänger- bis Fortgeschrittenen-Level Tester und Entwickler, die Selenium mit Python verwenden möchten, um Webanwendungstests in realen Umgebungen zu automatisieren.
Am Ende dieser Schulung werden die Teilnehmer in der Lage sein:
- Selenium mit Python in einer Testumgebung zu installieren und einzurichten.
- Robuste Testautomatisierungsskripte unter Verwendung von Selenium WebDriver und Pytest zu erstellen.
- Page Object Model (POM) anzuwenden, um wartbare Testrahmen zu erstellen.
- Tests in mehreren Browsern mit Selenium Grid auszuführen.
- Automatisierte Tests in CI/CD-Pipelines zu integrieren.
- Häufige Probleme zu beheben und beste Praktiken für die Stabilität der Automatisierung anzuwenden.
Kursformat
- Interaktive Vorlesung und Diskussion.
- Viele Übungen und Praxis.
- Hands-on-Implementierung in einer Live-Lab-Umgebung.
Kursanpassungsoptionen
- Für eine angepasste Schulung zu diesem Kurs wenden Sie sich bitte an uns, um die Anforderungen abzustimmen.
Textzusammenfassung mit Python
14 StundenIn Python Machine Learning kann die Funktion zur Textzusammenfassung den Eingabetext lesen und eine Textzusammenfassung erstellen. Diese Funktionalität ist über die Befehlszeile oder als Python API/Bibliothek verfügbar. Eine spannende Anwendung ist die schnelle Erstellung von Managementzusammenfassungen, was besonders für Organisationen nützlich ist, die große Textmengen prüfen müssen, bevor sie Berichte und Präsentationen erstellen.
In dieser von einem Dozenten geleiteten Live-Schulung lernen die Teilnehmer, wie sie Python verwenden, um eine einfache Anwendung zu erstellen, die automatisch eine Zusammenfassung des Eingabetextes generiert.
Am Ende dieser Schulung werden die Teilnehmer in der Lage sein:
- Ein Befehlszeilentool zur Textzusammenfassung verwenden.
- Textzusammenfassungscode mithilfe der Python-Bibliotheken entwerfen und erstellen.
- Drei Python-Zusammenfassungsbibliotheken bewerten: sumy 0.7.0, pysummarization 1.0.4, readless 1.0.17
Zielgruppe
- Entwickler
- Datenwissenschaftler
Format des Kurses
- Teilweise Vorlesung, teilweise Diskussion, Übungen und umfangreiche praktische Übungen