Ollama: lokal, in der Cloud oder beides

Betreiben Sie Pinchy-Agenten mit lokalem Ollama, dann arbeiten sie voll offline. Oder mit Ollama Cloud für EU-freundliche, verwaltete Modelle. Gleicher Anbieter, andere Betriebsform, frei wählbar je Agent.

Pinchy-Anbietereinstellungen: Ollama als Modell-Anbieter einrichten

Lokale Modelle sind kein Kompromiss mehr

Früher hieß Selbstbetrieb: weniger können. Die starken Modelle waren geschlossen, die lokalen rau, der Qualitätsabstand echt. Das hat sich gedreht. Moderne offene Modelle wie Qwen, Llama oder DeepSeek genügen für einen großen Teil der Unternehmensarbeit, gerade für die Posteingang-Arbeit, auf die Pinchy-Agenten spezialisiert sind.

Pinchy unterstützt Ollama als vollwertigen Anbieter. Sie binden einen lokalen Ollama-Server an und sprechen nie wieder mit einer externen Schnittstelle. Oder Sie nutzen Ollama Cloud, wenn Sie verwaltetes Hosting wollen, ohne das Ollama-Ökosystem zu verlassen.

Lokales Ollama oder Ollama Cloud

Lokales Ollama

Installieren Sie Ollama auf einem Server, den Sie selbst kontrollieren: eine Workstation, ein GPU-Rechner im Rechenzentrum, eine eigene VM. Pinchy verbindet sich über eine Basis-URL. Kein externer Aufruf. Geeignet für air-gapped und regulierte Umgebungen.

Ollama Cloud

Verwaltetes Hosting durch Ollama mit demselben Schnittstellen-Vertrag. EU-freundliche Alternative zu US-Anbietern, wenn Sie verwalteten Komfort ohne die Last des CLOUD Act wollen.

Wahl je Agent

Kombinieren Sie frei. Sensibler Finanz-Agent zu lokalem Ollama. Kundennaher Entwurfs-Agent zu Claude. Interner Helfer zu Ollama Cloud. Der Anbieter gehört zum Agenten, nicht zur Installation.

Gut für den Selbstbetrieb

Für EU-Unternehmen zwischen US CLOUD Act und DSGVO ist Ollama die sauberste Lösung, lokales Ollama erst recht. Kein US-Cloud-Anbieter im Spiel, keine Datenübertragung über den Atlantik, kein Risiko durch den CLOUD Act. Die Architektur erfüllt die Vorgaben von sich aus, nicht erst per Auftragsverarbeitungsvertrag.

Kombinieren Sie das mit dem Selbstbetrieb von Pinchy, dem Audit-Trail und eng begrenzten Berechtigungen. So steht eine Plattform, die sich auch in Banken, im Gesundheitswesen, in Kanzleien und Behörden einsetzen lässt.

Verwandte Seiten

Frequently asked questions.

Unterstützt Pinchy Ollama?

Ja. Pinchy unterstützt Ollama als vollwertigen Modell-Anbieter, für lokale Ollama-Installationen ebenso wie für Ollama Cloud. Sie wählen das Modell je Agent: ein lokales Qwen oder Llama für sensible Arbeit, ein gehostetes Spitzenmodell für einen anderen Agenten. Die Wahl trifft jeder Agent für sich.

Kann ich Pinchy mit Ollama voll offline betreiben?

Ja. Kombinieren Sie Pinchy mit lokalem Ollama, dann verlässt nichts Ihr Netzwerk. Kein externer Schnittstellen-Aufruf, keine Cloud-Abhängigkeit, kein Telemetrie-Abfluss. Für regulierte Branchen und air-gapped Umgebungen ist genau das der Punkt.

Worin unterscheiden sich lokales Ollama und Ollama Cloud?

Lokales Ollama betreibt Modelle auf Ihrer eigenen Hardware: Ihre CPU oder GPU, Ihre Latenz, Ihre Grenzen. Ollama Cloud hostet Modelle auf Ollamas Infrastruktur, mit einem Schnittstellen-Vertrag, der dem lokalen Betrieb sehr ähnelt. Pinchy spricht beide über denselben Anbieter an. Sie wechseln, indem Sie eine Basis-URL ändern.

Kann ich Ollama mit anderen Anbietern mischen?

Ja. Verschiedene Agenten nutzen verschiedene Anbieter. Ein Finanz-Agent läuft mit lokalem Qwen über Ollama, ein kundennaher Agent mit Claude, ein interner Schreibhelfer mit GPT. Pinchy ist je Agent modellunabhängig.

Bereit loszulegen?

Betreiben Sie Pinchy in wenigen Minuten selbst, oder vereinbaren Sie ein Gespräch. Sie haben die Wahl.

Oder schreiben Sie uns: info@heypinchy.com