AI Engineer
IT Services
Skysec Defence ist ein Schweizer Unternehmen, das sich auf die Entwicklung modernster C-UAS (Counter-Unmanned Aircraft Systems) Lösungen spezialisiert hat.
Mit unserem Team aus erfahrenen Ingenieuren und Entwicklern arbeiten wir an der Spitze der Drohnentechnologie und entwickeln Systeme, die neue Massstäbe in der Luftabwehr setzen.
Deine Rolle
Du möchtest künstliche Intelligenz nicht nur anwenden, sondern lokale AI-Infrastruktur aktiv betreiben, optimieren und weiterentwickeln?
In dieser Rolle bist du verantwortlich für unsere on-premise betriebene AI-Umgebung. Aufgrund unseres Tätigkeitsfelds im sicherheitskritischen Umfeld setzen wir bewusst auf No-Cloud, Open Source First und lokal betriebene Modelle.
Du arbeitest mit unserem eigenen AI-Cluster, dockerisierten AI-Modellen, GPU-unterstützten Systemen, zentralen Schnittstellen wie OpenLLM sowie Inferenz-Stacks wie vLLM, SGLang oder vergleichbaren Technologien. Dein Fokus liegt auf Performance, Verfügbarkeit, Stabilität, Automatisierung, Monitoring und der sinnvollen Integration von AI in unsere internen Prozesse und Entwicklungsabläufe.
Es handelt sich nicht um eine reine Prompting- oder Research-Rolle. Wir suchen jemanden, der AI-Systeme produktiv betreiben, Modelle bewerten, Infrastruktur verstehen und lokale AI-Lösungen technisch weiterbringen kann.
Das bewegst du bei uns
- Du betreibst, wartest und optimierst unseren lokalen AI-Cluster
- Du arbeitest mit dockerisierten AI-Modellen und GPU-unterstützten Systemen
- Du stellst sicher, dass unsere lokalen Modelle stabil, schnell und hoch verfügbar betrieben werden
- Du evaluierst neue Open-Source-Modelle und prüfst deren Einsatzfähigkeit für unsere Anforderungen
- Du testest, vergleichst und optimierst Modelle hinsichtlich Performance, Qualität, Ressourcenverbrauch und Stabilität
- Du findest geeignete Parametrisierungen für Modelle und automatisierst Test- und Optimierungsprozesse
- Du betreust zentrale AI-Schnittstellen wie OpenLLM und stellst diese für interne Applikationen bereit
- Du arbeitest mit Inferenz-Stacks wie vLLM, SGLang oder alternativen Lösungen, wenn diese bessere Resultate liefern
- Du integrierst AI-Funktionen in interne Tools, Chat-Anwendungen, Entwicklungsworkflows und Automatisierungsprozesse
- Du unterstützt AI-gestützte Entwicklungs- und Programmierprozesse im Unternehmen
- Du arbeitest mit Automatisierungslösungen wie n8n und AI-Integrationen
- Du baust Monitoring für Modelle, Cluster, Ressourcen, Performance und Verfügbarkeit auf und entwickelst es weiter
- Du arbeitest nach MLOps-Prinzipien und unterstützt den produktiven Lebenszyklus von AI-Modellen
- Du dokumentierst Modelle, Konfigurationen, Schnittstellen und Betriebsprozesse nachvollziehbar
- Du beteiligst dich an der Evaluation neuer Hardware und spezialisierter GPU-Systeme
- Du unterstützt bei Assemblierung, Konfiguration und Ausbau unserer lokalen AI-Systeme
- Du bringst dich aktiv in die Weiterentwicklung unserer AI-Plattform und internen AI-Strategie ein
Das bringst du mit
- Fundierte Erfahrung mit AI-Systemen, Large Language Models oder vergleichbaren Machine-Learning-Anwendungen
- Gutes Verständnis für den Betrieb von lokalen oder selbst gehosteten AI-Modellen
- Erfahrung mit Docker, containerisierten Umgebungen und Linux-Systemen
- Erfahrung mit GPU-basierten Workloads und Performance-Optimierung
- Verständnis für Inferenz, Modellparameter, Kontextlängen, Quantisierung, Ressourcenverbrauch und Latenz
- Erfahrung mit Open-Source-Modellen und Bereitschaft, neue Modelle systematisch zu evaluieren
- Interesse an MLOps, Monitoring, Automatisierung und produktivem Betrieb von AI-Systemen
- Fähigkeit, Modelle kritisch zu testen und deren Nutzen für konkrete Anwendungsfälle zu beurteilen
- Verständnis für Schnittstellen, APIs und die Integration von AI in bestehende Applikationen
- Bewusstsein für Datenschutz, Security und den Betrieb sensibler Systeme ohne Cloud-Abhängigkeit
- Strukturierte, selbstständige und lösungsorientierte Arbeitsweise
- Freude daran, neue Technologien auszuprobieren, aber pragmatisch und robust in den Betrieb zu überführen
Nice to have
- Erfahrung mit OpenLLM, vLLM, SGLang oder vergleichbaren Inferenz-Frameworks
- Erfahrung mit n8n, Workflow-Automatisierung oder AI-gestützten Prozessketten
- Erfahrung mit Monitoring von AI-Systemen, GPU-Ressourcen, Latenzen und Modellverfügbarkeit
- Erfahrung mit MLOps-Tools, Modellversionierung, Deployment-Pipelines oder automatisierten Tests
- Kenntnisse in Python, APIs, Skripting oder Backend-Integration
- Erfahrung mit GPU-Hardware, Treibern, CUDA, VRAM-Management oder Hardware-Evaluation
- Erfahrung mit lokalen AI-Clustern oder selbst aufgebauter AI-Infrastruktur
- Verständnis für AI-gestützte Softwareentwicklung und moderne Coding-Workflows
- Erfahrung mit Retrieval-Augmented Generation, Embeddings oder internen Wissenssystemen
- Interesse an sicherheitskritischen, vollständig on-premise betriebenen AI-Lösungen
Was wir dir bieten können
Motivierendes Umfeld
- Flache Hierarchien, klare Ziele und moderne Technologie
Flexible Arbeitszeiten
- Gleitarbeitszeit für eine gute Work-Life-Balance
Zukunftstechnologie
- Arbeite an der Drohnentechnologie von morgen mit
Bezahlte Zertifizierungen
- Drohnenprüfungen, Erneuerungen und relevante Weiterbildungen werden unterstützt
Innovation wird gefördert
- Deine Ideen sind willkommen und werden aktiv weiterverfolgt
Gratis Kaffee
- Bester Kaffee der Kaffeerösterei Küng, kostenlos für alle
Fitness-Abo
- Vergünstigtes Fitness-Abo direkt neben dem Büro
Attraktive Konditionen
- Attraktive Vergütung und wachsende Sozialleistungen
Team-Events
- Regelmässige Teamevents, Apéros und gemeinsame Essen
Bereit, mit uns die Drohnentechnologie der Zukunft zu gestalten?
Dann freuen wir uns auf deine Bewerbung!
Stellendetails
Jetzt bewerben