623eef814b
DONE.md: 16/16 items completed, 11 commits, 3-agent verified. FUTURE_WORKS.md: rewritten with only remaining items: - FW-L1: SQLite WAL migration (FW-02 long-term) - FW-L2: stop option semantics Step 2 (FW-03/13 follow-up) - FW-N1: reconcile.sh idle timeout vs job timeout mismatch (new) - FW-N2: wire format compat (HMAC rollout) (new) - FW-N3: log message 'auth_token mismatch' -> 'HMAC verify failed' (new) - FW-N4: REPORT.md section 2.4 plaintext auth_token -> HMAC (new)
4.4 KiB
4.4 KiB
FUTURE_WORKS.md
목적:
advanced_multi_agent프로젝트의 향후 작업 후보를 추적한다. 완료된 항목은DONE.md를 참조. 최종 갱신: 2026-06-21 (3개 에이전트 최종 검증 완료 후)
1. 장기 과제 (근본적 구조 변경)
FW-L1. SQLite WAL 마이그레이션 (FW-02 장기 후속)
- 상태: FW-02 단기 대응(NFS 경고) 완료. 장기 해결 미진행.
- 문제:
atomic_dump_yaml의 fcntl.flock이 NFS/NAS 환경에서 무시됨. 현재는 WARNING 로그만 출력. - 해결 방안: YAML 레지스트리를 SQLite WAL(Write-Ahead Logging) 백엔드로 마이그레이션.
- 작업량: 대 (Large) — 데이터 레이어 전면 교체
- 우선순위: NFS 환경 배포 시 필수, 로컬 단일 환경에서는 낮음
FW-L2. stop 옵션 시맨틱 Step 2 (FW-03/FW-13 후속)
- 상태: Step 1(디렉터리/식별자 rename) + frontmatter/산문 재작성 완료. Step 2 미진행.
- 남은 작업:
--purge-conversation(진짜 삭제)와--mode soft|hard의 시맨틱 재정의 또는 폐기 검토- 하위 호환 코드 제거
--mode soft|hard폐기 후stop= 기본 동작,--purge-conversation= 파괴적 옵션으로 명확화
- 작업량: 중 (Medium)
- 우선순위: 보통 — 현재 동작에 문제 없으나 API 직관성 향상
2. 신규 발견 항목 (최종 검증에서 식별)
FW-N1. reconcile.sh 모니터 유휴 타임아웃 vs 잡 타임아웃 불일치
- 발견자: agy-existing (최종 검증)
- 문제:
reconcile.sh의SUB_IDLE_TIMEOUT기본값 600s가 잡 wall-clock timeout 기본값 3600s와 불일치. 모니터가 잡보다 먼저 타임아웃되어 조기 종료 간섭 가능. - 영향 범위:
skills/tmux-agent-orchestrate-monitor/scripts/reconcile.sh:66부근 - 해결 방안: 모니터 유휴 타임아웃을 잡 타임아웃과 독립적으로 문서화하거나, 기본값을 3600s 이상으로 조정.
- 작업량: 소 (Small)
- 우선순위: 낮음 — 별개 도메인(모니터 유휴 vs 잡 wall-clock)이나 문서화 필요
FW-N2. 와이어 포맷 호환성 (HMAC 전환 후 혼합 배포)
- 발견자: claude-existing (Batch 2 리뷰)
- 문제:
data.auth_token→data.hmac_sig와이어 포맷 변경. 구 버전(publish_event.py)과 신 버전(job_subscriber.py)이 혼재하는 롤아웃 시 모든 이벤트가 drop될 수 있음. - 해결 방안: 롤아웃 시 전체 노드 동시 업데이트 또는 하위 호환 모드(auth_token + hmac_sig 동시 전송) 추가.
- 작업량: 소 (Small)
- 우선순위: 낮음 — 단일 노드 Canary 환경에서는 해당 없음
FW-N3. 로그 문구 "auth_token mismatch" → "HMAC verify failed" 갱신
- 발견자: claude-existing (Batch 2 리뷰)
- 문제:
job_subscriber.py의 drop 로그가 여전히 "auth_token mismatch"를 사용. HMAC 검증으로 변경되었으나 로그 미갱신. - 해결 방안: 로그 문구를 "HMAC verify failed"로 변경.
- 작업량: 소 (Small)
- 우선순위: 낮음 — 기능 영향 없음, 디버깅 가독성만
FW-N4. Messaging_System_REPORT.md §2.4 평문 auth_token 기술 갱신
- 발견자: claude-existing (Batch 2 리뷰)
- 문제: 보고서 §2.4가 여전히 "plaintext bearer auth_token" 기술. HMAC 서명으로 변경되었으나 문서 미갱신.
- 해결 방안: §2.4를 HMAC-SHA256 서명 방식으로 갱신.
- 작업량: 소 (Small)
- 우선순위: 보통 — 권위 문서의 정확성
3. 분석 인프라 개선 (다음 분석 라운드 시)
근본 원인: pane TUI의 자체적인 위쪽 truncate + subagent의 pane 추출 시점 차이로 긴 응답이 스크롤아웃됨.
검증된 패턴 (delegate-job SKILL.md "Subagent Orchestration Pattern" 섹션에 반영됨):
- brief 직후
capture-pane -S -200즉시 캡처 → 누적 백업 - 응답 진행 중 30초마다
>> /tmp/pane-snap.txt누적 - "분석 종료" 직후에도 한 번 더 전체 캡처
- 짧은 작업(<5min)은 폴링이 MQTT subscriber보다 안정적
- 긴 brief는 파일 경로로 전달 (inline send-keys는 TUI가 swallow)
4. 변경 이력
| 날짜 | 변경 |
|---|---|
| 2026-06-21 | 초기 작성 — 3개 에이전트 분석 결과 (FW-01~FW-16) |
| 2026-06-21 | FW-01 |