목차(클릭하세요)
오픈클로, Hermes 모두 사용가능하지만, 오픈클로는 뭔가 꺼림직…
Hermes로 온라인 Agent사용하기의 모든 것
PC 한 대에 Hermes Agent + Ollama 을 올려, 슬랙 하나로 어디서든 3단계 모델 라우팅 AI 에이전트를 무료에 가깝게 운용함
[참고자료]
[참고자료]
1. Hermes Agent란 무엇인가?
1-1. OpenClaw vs Hermes Agent
항목 | OpenClaw | Hermes Agent |
주용도 | 24시간 개인 비서·자동화 | 다목적 실험·학습 에이전트 |
실행 환경 | 내 서버/PC (백그라운드) | 터미널 CLI / 메신저 |
LLM 선택 | 다양한 API 연동 가능 | 200개 이상 자유 선택 |
자기 학습 | ||
Obsidian 연동 | ||
보안 risk( 위험도) | 높음 (광범위한 권한) | 중간 |
Windows 네이티브 | ||
진입 장벽 | 높음 | 중간 |
OpenClaw와 Hermes는 구조적으로 거의 동일한 아키텍처. Obsidian 연동과 스킬 자동 생성이 Hermes를 선택한 핵심 이유임
나만의 두뇌를 만들기 위한 최적의 서비스!
•
이걸 쓰고 싶은데, 이게 위험하다니까, 차선책을 찾다보니.. 더 좋은게 얻어걸린 느낌??
•
OpenClaw는 광범위한 도구 통합 기능을 갖춘 생태계 우선 접근 방식을 취하는 반면,
•
Hermes-Agent는 학습 우선 아키텍처를 기반으로 구축
•
OpenClaw는 다양한 도구와 서비스를 조율하는 컨트롤러 역할을 하는 데 중점을 두는 반면,
•
Hermes는 에이전트 자체의 실행 루프에 집중하고 이를 중심으로 시스템을 구축
•
Hermes-Agent의 가장 큰 장점 중 하나는 정교한 메모리 시스템.
◦
OpenClaw의 정적인 메모리 아키텍처와 달리, Hermes는 경험을 토대로 기술과 지식으로 통합하는 동적 메모리 시스템을 구현
1-2. 관련 개념-Tool Calling 루프
•
Agent가 목적을 향해 스스로 계획하고 작동하기 위한 핵심 개념:Tool Calling 루프
•
"LLM이 스스로 도구를 선택하고 실행하는 반복 구조"
•
일반 LLM은 질문 → 답변으로 끝나지만 Tool Calling루프를 포함한 AI Agent는 다름.
[Hermes Agent의 특장점]
Tool Calling 루프 (에이전트의 핵심 개념)
+
메모리 누적 관리
+
멀티플랫폼 게이트웨이 (슬랙, 디스코드 등)
+
스킬 자동 생성·개선
+
Obsidian 연동
+
모델 라우팅 (fallback_providers)
Plain Text
복사
1-3. Windows 설치 가능여부
"WSL2, Docker, Cygwin 없이 Windows에서 직접 실행 가능"
v0.14.0부터 Early Beta로 공식 지원
•
Hermes Agent는 원래 Linux 기반으로 설계되었으나, v0.14.0(2026.5.16)부터 Windows 네이티브 설치를 공식 지원
•
Early Beta 상태라 WSL2만큼 완전히 안정적이지 않으나, 일반 자동화 용도에서는 충분히 사용 가능
Windows 11
└── Hermes Agent (네이티브 실행)
└── PowerShell로 설치 및 실행
→ 관리자 권한 불필요
→ %LOCALAPPDATA%\hermes\ 에 설치
Plain Text
복사
•
설치는 PowerShell 한 줄로 완료
iex (irm https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.ps1)
PowerShell
복사
•
설치 후 새 터미널 열고 확인:
hermes --version
PowerShell
복사
•
Ollama도 Windows 네이티브 지원이라 둘 다 WSL2 없이 Windows에서 직접 실행
[네이티브 vs WSL2 기능 비교]
기능 | Windows 네이티브 | WSL2 |
CLI / 메시징 게이트웨이 | ||
슬랙 Socket Mode | ||
로컬 Ollama 연동 | ||
대시보드 내장 터미널 | ||
로그인 시 자동 시작 | ||
안정성 |
1-4. 슬랙 계정이 필요한 이유
[참고] Hermes Agent 공식 지원 메신저: Hermes 를 작동시키려면 메신져가 필요
학교망 기준: 슬랙이 유일한 방법
•
슬랙 하나로 학교·집·폰 모두 통일. 별도 웹 대시보드 불필요
메신저 | Hermes 지원 | 학교망 |
슬랙 | ||
디스코드 | ||
텔레그램 | ||
카카오톡 |
2. 최종 아키텍처
2-1. 전체 구조도
슬랙 (학교 ✅ / 집 ✅ / 스마트폰 ✅)
↓
Socket Mode (WebSocket, 공개 URL 불필요)
↓
데스크톱 Windows (네이티브)
└── Hermes Agent
├── 단순 작업 → Gemma 4 E2B (Ollama 로컬, 무료)
├── 중간 작업 → Gemini 3.1 Flash-Lite API (무료 티어 소진 후 유료)
└── 복잡 작업 → Gemini 3.5 Flash API (무료 티어 소진 후 유료)
↓
Obsidian Vault
(LLM 사용 기록 자동 저장)
Plain Text
복사
2-2. 3단계 모델 라우팅
•
1단계는 로컬LLM을 사용, 2단계는 Gemini 3.1모델 호출, 3단계는 Gemini3.5 모델 호출
단계 | 모델 | 용도 | 비용 |
1단계 | Gemma 4 E2B (로컬) | 분류, 짧은 요약, 단순 응답 | 전기세만 |
2단계 | Gemini 3.1 Flash-Lite | 데이터 처리, 자동화 실행 | 무료 티어 |
3단계 | Gemini 3.5 Flash | 깊은 추론, 멀티스텝 에이전트 | 무료 티어 소진 후 유료 |
모델 선택 판단은 Hermes가 자동으로 수행. fallback_providers 설정으로 우선순위 지정함
2-3. PC 상태별 폴백 전략
PC 켜져있을 때 (평상시)
├── 단순 → Gemma 4 E2B 로컬 (비용 0원)
├── 중간 → Gemini 3.1 Flash-Lite (무료 티어 소진 후 유료)
└── 복잡 → Gemini 3.5 Flash (무료 티어 소진 후 유료)
PC 꺼졌을 때 (재부팅 / 점검)
├── 로컬 모델 없음 → 자동 감지
├── 단순 → Gemini 3.1 Flash-Lite로 자동 대체
└── 복잡 → Gemini 3.5 Flash
Plain Text
복사
Hermes fallback_providers 설정 한 번으로 자동 전환됨. 별도 코드 불필요
터널은 속도에 영향 없음. 보안만 강해지는 구조
3. 설치 스택 및 순서
3-1. 설치 목록
도구 | 설치 방법 | 역할 |
Hermes Agent | PowerShell 한 줄 설치 | 에이전트 루프 전체 |
Ollama (Windows 네이티브) | exe 설치 | 로컬 LLM 실행 |
Gemma 4 E2B | ollama pull gemma4:e2b | 로컬 추론 모델 |
Obsidian | exe 설치 | 대화 기록 저장 |
3-2. 권장 설치 순서 (5+1단계)
1단계: Ollama 설치 + Gemma 4 E2B 다운로드
→ 로컬 LLM 첫 실행 경험
→ 터미널에서 직접 대화 테스트
2단계: Hermes Agent Windows 네이티브 설치
→ PowerShell에서 설치 스크립트 실행
→ 새 터미널 열고 hermes --version 확인
3단계: Hermes Agent 세팅
→ 슬랙 앱 생성 + Socket Mode 활성화
→ SLACK_BOT_TOKEN, SLACK_APP_TOKEN 발급
→ Hermes 설정 파일에 토큰 입력
→ 슬랙에서 첫 에이전트 대화 확인
4단계: Gemini API 연동 테스트
→ Google AI Studio에서 API 키 발급 확인
→ Flash-Lite 호출 테스트
→ 3.5 Flash 호출 테스트
→ API 키 정상 작동 여부 점검
5단계: Hermes Agent 3단계 모델 라우팅 + fallback 설정
→ Hermes 설정 파일에 providers 순서 지정
1순위: Gemma 4 E2B (Ollama 로컬)
2순위: Gemini 3.1 Flash-Lite
3순위: Gemini 3.5 Flash
→ fallback_providers 설정 완료
→ PC 켜짐: E2B 로컬 우선 실행 확인
→ PC 꺼짐: Flash-Lite 자동 대체 확인
→ 3.5 Flash 자동 전환 테스트
6단계: Obsidian 연동
Plain Text
복사
4.Hermes Agent 세팅
Hermes Agent를 Windows 네이티브로 설치하고, 슬랙 Socket Mode로 첫 연동을 완료함
[참고]
4-1. Hermes Agent 설치
•
Windows 네이티브 설치: PowerShell에서 한 줄로 완료
•
관리자 권한까지 푤요 없음, %LOCALAPPDATA%\hermes\ 에 설치됨
•
설치가 완료되면 ‘hermes' 를 검색해보기
# PowerShell에서 실행
iex (irm https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.ps1)
PowerShell
복사
•
참고로 uv, Python 3.11을 설치하고 저장소를 클론하여 모든 것을 설정해줌
•
관련 라이브러리를 한꺼번에 모두 설치해주는 모습, 설치가 완료되면 Quick setup으로 먼저 기본 세팅하고, 나중에 세부 조정하기
•
gemini API키를 연계할 목적이므로 15번만 선택하기
•
Base URL은 건드릴 필요없음
사용할 제미나이 모델을 선택 후
Base URL = Gemini API 서버 주소
기본값: https://generativeai.googleapis.com/v1beta
→ 일반 사용자는 바꿀 필요 없음
→ 기업용 프록시나 커스텀 엔드포인트 쓸 때만 변경
Bash
복사
•
로컬에서 실행할 예정이므로 여기서는 7번 선택
슬랙연동을 진행해야 하니 ‘messaging’선택
•
이후 슬랙과 구글챗을 순서대로 선택하기, 2번 enter, 17번 enter
•
설치 완료 후 새 터미널 열고 확인
hermes --version
PowerShell
복사
4-2. 슬랙 앱 생성 + Socket Mode 활성화
[1단계]슬랙 앱 생성 순서
•
참고로 슬랙의 워크스페이스에서 채널이 ‘공개’채널이여야 나중에 챗봇이 작동을 잘함
1. https://api.slack.com/apps 접속
2. Create New App → From a manifest
3. 앱 이름 입력 (예: hermes-bot)
4. 워크스페이스 선택 → Create App
Plain Text
복사
•
From a manifest: 설정 파일을 붙여넣으면 자동으로 세팅
•
From scratch: 하나하나 수동으로 설정
•
이후 App name과 워크 스페이스 선택
•
왼쪽의 Settings → Socket Mode → Enable Socket Mode
활성화
[2단계]Socket Mode 활성화방법
Settings → Socket Mode → Enable Socket Mode ✅
→ App-Level Token 생성
→ 이름 입력 (예: hermes-socket)
→ connections:write 권한 추가
Bash
복사
•
xapp- 로 시작하는 토큰을 복사하기 (SLACK_APP_TOKEN)
[3단계]Bot Token 발급과정
•
왼쪽에서 Features → OAuth & Permissions 선택 → Bot Token Scopes 추가
•
봇 토큰 범위 → OAuth 범위 추가 클릭해서 아래 5개 추가
•
페이지 위로 올라가서 Install to Workspace 버튼 클릭
•
여기서 만들어진 Bot User OAuth Token 복사
[4단계]Event Subscriptions활성화
•
Subscribe to Bot Events: app_mention 추가
•
message.channels 추가
•
마지막으로 Save Changes
4-3. 터미널에서 Hermes 설정 파일에 토큰 입력
•
마찬가지로 토큰키이므로 화면에 드러나지 않게 됨
•
토큰을 입력하면 설치된 헤르메스 폴더안의 config.yaml파일에 그 정보가 저장되는 방식
# %USERPROFILE%\.hermes\config.yaml
platforms:
slack:
enabled: true
bot_token: "xoxb-your-bot-token"
app_token: "xapp-your-app-token"
YAML
복사
•
설치 후 마지막에 PC부팅시 자동시작을 위해 y입력
gateway 실행하기
그뒤 대부분 y선택
•
최종적으로 Hermes Gateway설정이 완료되었다는 메시지를 보면 됨!
4-4. 첫 에이전트 대화 확인
# Hermes 실행
hermes gateway start
Bash
복사
0.
슬랙 패키지 설치하기
•
헤르메스 에이전트가 설치된 폴더로 이동한 다음
•
파워셀에서 명령어 입력
pip install 'hermes-agent[slack]'
Bash
복사
•
이후 hesmesgateway 재시작
hermes gateway restart
Bash
복사
1.슬랙에서 채널 하나 선택 (또는 새 채널 생성)
2 .채널에 hermes-bot 초대
→ /invite @hermes-bot 입력
3.
채널에서 멘션
→ @hermes-bot 안녕
# 슬랙에서 봇 멘션
@hermes-bot 안녕
→ 응답 오면 연동 성공 ✅
Bash
복사
5. Ollama + Gemma 4 E2B 연동
5-1.Hermes config.yaml에 Ollama 연동 추가
•
해당 파일을 메모장으로 연뒤, roviders: {} 부분을 찾아서 아래로 교체
providers:
ollama:
model: gemma4-gpu:latest
base_url: http://localhost:11434/v1
Bash
복사
•
저장 후 gateway 재시작
hermes gateway restart
Bash
복사
5-2.Ollama 연동 확인하기
•
슬랙에서 사용중인 모델 확인하기
@hermes-bot 안녕, 지금 어떤 모델 쓰고 있어?
Bash
복사
•
기본 모델을 Ollama로 변경하기
•
올라마 모델을 hermes에 인식시키기
hermes model
Bash
복사
•
설정이 바뀔때 마다 다음 명령어로 hermes 재실행
hermes gateway restart
Bash
복사
5-3.대화기록 확인
•
파워셀에서 다음 명령어 입력
hermes logs
Bash
복사
6. Gemini API 키 준비
Google AI Studio에서 API 키를 확인가능
API 키 확인
https://aistudio.google.com 접속
→ Get API Key → API 키 복사
Plain Text
복사
7. Hermes Agent fallback 설정
•
fallback은 PC on/off에 따른 모델 자동 변환
PC 켜져있을 때 (평상시)
├── 단순 → Gemma 4 E2B 로컬 (비용 0원)
├── 중간 → Gemini 3.1 Flash-Lite (무료 티어 소진 후 유료)
└── 복잡 → Gemini 3.5 Flash (무료 티어 소진 후 유료)
PC 꺼졌을 때 (재부팅 / 점검)
├── 로컬 모델 없음 → 자동 감지
├── 단순 → Gemini 3.1 Flash-Lite로 자동 대체
└── 복잡 → Gemini 3.5 Flash
Plain Text
복사
7-1.config.yaml에서 총 2군데 수정하기
7-2. gemini api_key 수정
gemini:
api_key: "YOUR_GEMINI_API_KEY"
Bash
복사
7-3.fallback_providers 설정(PC on/off상태일때의 모델 우선순위)
providers:
ollama:
model: gemma4-gpu:latest
base_url: http://localhost:11434/v1
gemini:
api_key: "YOUR_GEMINI_API_KEY"
fallback_providers:
- provider: gemini
model: gemini-3.1-flash-lite
- provider: gemini
model: gemini-3.5-flash
YAML
복사
7-3. 동작 방식
Hermes fallback_providers 설정 한 번으로 자동 전환됨. 별도 코드 불필요
7-4. 전환 테스트(PC on/off에 따른 모델 자동 변환 테스트)
•
로컬 모델을 자동으로 종료한뒤, 모델변환이 일어나는지 확인하기
•
Ollama를 강제로 중지시키고 질문하면 자동으로 Gemini로 전환되는지 확인할 수 있음
# Ollama 중지
taskkill /F /IM ollama.exe
Bash
복사
•
중지 후 슬랙에서
대한민국의 교육제도 장단점을 분석해줘
Bash
복사
•
응답이 오고난뒤, 파워셀에서 확인
model=gemini-3.1-flash-lite 로 찍혀있으면 2단계 정상 작동
hermes logs
Bash
복사
8. Hermes Agent 3단계 모델 라우팅 + fallback 설정
작업 난이도에 따라 로컬 모델 ‘3.1Flash-Lit’e 또는 ‘3.5 Flash’로 수동 전환되도록 설정
PC 켜져있을 때 (평상시)
├── 단순 → Gemma 4 E2B 로컬 (비용 0원)
├── 중간 → Gemini 3.1 Flash-Lite (무료 티어 소진 후 유료)
└── 복잡 → Gemini 3.5 Flash (무료 티어 소진 후 유료)
PC 꺼졌을 때 (재부팅 / 점검)
├── 로컬 모델 없음 → 자동 감지
├── 단순 → Gemini 3.1 Flash-Lite로 자동 대체
└── 복잡 → Gemini 3.5 Flash
Plain Text
복사
8-1. 핵심 원리
•
Hermes는 smart_model_routing 모드를 지원해서 짧고 단순한 턴은 저렴한 모델로, 복잡한 턴은 고성능 모델로 자동 라우팅할 수 있었으나, v0.13.0에서 제거되어, 수동번환이 더 효율적이게 되버림
단순 → model=gemma4-gpu:latest
복잡 → model=gemini-3.1-flash-lite 또는 gemini-3.5-flash
8-2. 모델 별칭을 통한 모델 자동 변환
•
config.yaml 맨 아래에 추가하기
# 파일 맨 아래
model_aliases:
local:
model: gemma4-gpu:latest
provider: ollama
fast:
model: gemini-3.1-flash-lite
provider: gemini
powerful:
model: gemini-3.5-flash
provider: gemini
YAML
복사
•
이 후 슬랙에서 모델 전환 → 이후 답변확인하기
@hermes-bot /model fast
@hermes-bot /model powerful
YAML
복사
•
이렇게 스위치가 된 다음에 질문을 넣어야 함!
•
주의1: 모델 스위치와 질문을 같이하면 절대X
•
주의2: 잘못된 별칭을 부르면 안됨
9. 기타
9-1. 하드웨어 최소 사양
항목 | 최소 | 권장 |
CPU | 4코어 이상 | 8코어 이상 |
RAM | 16GB | 32GB |
GPU VRAM | 없어도 됨 (API만 사용 시) | 8GB (로컬 E2B 실행 시) |
저장공간 | 50GB 여유 | 100GB 이상 |
네트워크 | 유선랜 권장 | 유선랜 |
OS | Windows 10 이상 | Windows 11 |
GPU 없어도 Gemini API만으로 Hermes 운용 가능. 로컬 LLM은 선택사항임























































