AI에게 일을 시키는 건 미분이고, 원하는 결과를 얻는 건 적분이다 — 그런데 지도 밖의 영역은?
완벽한 프롬프트 한 줄이면 끝날 줄 알았다. 하지만 진짜 원하는 결과는 수십 번의 미세한 방향 수정이 쌓여야 나온다. 그런데 미적분이 작동하려면 먼저 올바른 지도 위에 서 있어야 한다.
완벽한 프롬프트 한 줄이면 AI가 알아서 해줄 줄 알았다.
실제로는 그렇지 않다. 에이전트에게 태스크를 던지고, 중간 결과를 보고, 방향을 틀고, 다시 보내고. 이걸 서너 번 반복해야 비로소 "아, 이거지"라는 결과가 나온다. 우리는 이 과정을 "티키타카"라고 부르고, 시스템 설계에서는 "휴먼 인 더 루프"라고 부른다. 그런데 이 반복 과정의 본질이 뭔지 제대로 설명하는 프레임은 의외로 드물다.
하나 제안한다. 미적분학. 단, 한 가지 전제를 먼저 짚고 가야 한다.
왜 자동화만으로는 수렴하지 않는가
AI 에이전트에게 복잡한 태스크를 맡기면, 에이전트는 주어진 지시문의 표면을 따라간다. 문제는 인간이 진짜 원하는 것이 그 지시문에 온전히 담기는 경우가 거의 없다는 점이다.
"보고서 작성해줘"라고 했을 때, 당신이 진짜 원하는 건 보고서가 아니다. 팀장이 읽고 고개를 끄덕이는 보고서, 의사결정에 쓸 수 있는 보고서, 혹은 다음 주 회의에서 방패가 되어줄 보고서다. 이 잠재적 목적함수는 당신 자신도 처음에는 명확히 모르는 경우가 많다. 중간 결과물을 보면서 "이건 아닌데"라는 감각으로 비로소 드러난다.
AI 오케스트레이션 시스템은 이 잠재적 목적함수를 모른 채 돌아간다. 표면 지시만 최적화한다. 그래서 자동화 파이프라인이 길어질수록 인간의 의도와 결과 사이의 드리프트가 누적된다. 자율주행 차가 핸들에서 손을 떼면 미세하게 차선을 이탈하기 시작하는 것과 같다. 처음 1초는 괜찮다. 10초도 어떻게든 된다. 하지만 1분이 지나면 도로 밖이다.
미분 — 지금 이 순간의 기울기를 읽는 눈
미분은 함수의 순간 변화율이다. "지금 이 순간, 결과물이 어느 방향으로 얼마나 빠르게 변하고 있는가."
휴먼 인 더 루프가 하는 일이 정확히 이것이다. 에이전트가 중간 결과를 내놓으면, 인간은 그것을 보고 기울기를 읽는다. "의도한 방향으로 가고 있나? 얼마나 벗어났나?" 그리고 "왼쪽으로 좀 틀어", "톤을 낮춰", "이 부분은 빼"라는 피드백으로 기울기를 교정한다.
티키타카는 이 미분을 짧은 간격으로 반복 샘플링하는 구조다. 샘플링 간격이 짧을수록 방향 이탈을 빨리 잡는다. 에이전트에게 30분짜리 태스크를 통째로 맡기는 것과, 5분마다 중간 점검하는 것의 차이가 여기에 있다.
물론 너무 잦은 개입은 에이전트의 자율성을 죽인다. 나이퀴스트 정리가 신호처리에서 말하듯, 적절한 샘플링 주파수가 있다. 너무 낮으면 정보를 놓치고, 너무 높으면 노이즈만 잡는다.
적분 — 작은 수정이 쌓여 결과가 된다
적분은 미분의 역이다. 순간 변화율들을 시간에 걸쳐 누적한 것. "작은 방향 수정들의 총합이 최종 산출물이다."
좋은 결과물은 한 번의 완벽한 지시에서 나오지 않는다. 첫 번째 피드백에서 방향이 10도 틀어지고, 두 번째에서 5도 더 조정되고, 세 번째에서 톤이 잡히고, 네 번째에서 빠진 맥락이 채워진다. 이 미세한 교정들이 적분되어 "내가 진짜 원하던 것"이 된다.
이걸 인정하면 설계 철학이 바뀐다. 프롬프트 엔지니어링의 성배가 "한 방에 완벽한 지시문"이 아니라, 피드백 루프의 설계라는 걸 깨닫게 된다.
이 프레임의 한계 — 미적분은 기존 지도 위에서만 작동한다
여기까지의 이야기는 강력하지만, 하나의 전제 위에 서 있다. 목적지가 이미 어딘가에 존재한다는 전제. 인간의 머릿속에 흐릿하게나마 "이런 결과를 원한다"는 상이 있고, 피드백 루프가 그 상을 점점 선명하게 만든다는 구조다.
미적분의 언어로 말하면, 이건 이미 정의된 함수 위에서 기울기를 따라가는 것이다. 경사하강법처럼. 어딘가에 최저점이 있고, 우리는 기울기를 읽으며 그 최저점으로 수렴한다.
그런데 진짜 어려운 문제는 함수 자체가 아직 정의되지 않은 경우다.
새로운 사업 기회를 탐색할 때, 아직 존재하지 않는 제품을 구상할 때, 지금까지 없던 프레임으로 문제를 재정의할 때 — 이런 상황에서는 "이건 아닌데"라는 감각조차 작동하지 않는다. 왜냐하면 비교할 내부 기준점이 없기 때문이다. 기울기를 읽으려면 함수가 먼저 있어야 한다. 함수가 없는 곳에서는 미분이 정의되지 않는다.
AI는 이 영역에서 구조적으로 약하다. 에이전트는 학습 데이터와 컨텍스트 윈도우 안에서 패턴을 조합한다. 기존에 존재하는 것들의 재배열에는 탁월하지만, 기존 지도 밖으로 나가는 것 — 전혀 새로운 컨텍스트를 발견하거나, 아직 아무도 묻지 않은 질문을 스스로 만들어내는 것 — 은 현재 아키텍처의 한계 안에 있다.
인간의 "이건 아닌데"는 잠재적 목적함수에서 오지만, "여기가 아니라 저쪽을 봐야 하는 거 아닌가?"는 그보다 더 앞선 감각이다. 탐색 공간 자체를 재정의하는 감각. 미적분 이전에 좌표계를 설정하는 행위. AI에게 이걸 기대하기는 아직 어렵다.
공동 탐색 — 미적분 이전의 지도 그리기
그렇다면 미적분 프레임은 언제 가장 잘 작동하는가? 방향은 있지만 선명하지 않을 때. "대충 이쪽인 것 같은데"라는 감각이 있고, AI와의 반복 피드백을 통해 그걸 구체화하는 상황. 수렴의 영역이다.
반면 "어디를 봐야 할지조차 모르겠다"는 상황에서는 다른 모드가 필요하다. 이걸 공동 탐색이라 부르자.
공동 탐색에서 AI의 역할은 방향을 따라가는 에이전트가 아니라, 가능성의 표면을 넓혀주는 도구다. 인간이 미처 생각하지 못한 조합을 보여주고, 다른 도메인의 프레임을 가져와 현재 문제에 겹쳐보고, 질문을 재구성해서 탐색 공간 자체를 바꾸는 역할. AI가 새로운 대륙을 발견하지는 못하지만, "이 방향에 뭔가 있을 수도 있다"는 지도의 빈 공간을 보여주는 데는 유용하다.
미적분 비유를 확장하면 이렇다. 공동 탐색은 미분하기 전에 함수를 정의하는 단계다. 여러 후보 함수를 스케치하고, 어떤 함수 위에서 최적화할 것인지를 선택하는 과정이다. 이 단계에서 AI가 할 수 있는 건 후보 함수를 많이 그려보는 것이고, 인간이 해야 하는 건 "이 함수가 우리 문제의 본질을 담고 있는가"를 판단하는 것이다.
이 단계가 끝나야 비로소 미적분이 시작된다.
제어 시스템으로서의 오케스트레이션 — 그리고 탐색 모드의 전환
제어공학에서 이 구조는 익숙하다. 피드백 제어 루프. 플랜트(AI 에이전트)가 출력을 내고, 센서(인간의 판단)가 출력을 측정하고, 컨트롤러(인간의 피드백)가 오차 신호를 생성해 플랜트에 다시 입력한다.
오케스트레이션 하네스는 단순 자동화가 아니다. 상태가 시간에 따라 변하는 동역학 시스템이다. 여기에 인간 피드백이 개입하는 제어 시스템을 얹은 것이 진짜 오케스트레이션이다.
그런데 좋은 오케스트레이션 시스템은 두 가지 모드를 갖는다. 탐색 모드와 수렴 모드. 탐색 모드에서는 AI를 넓게 풀어놓고 다양한 가능성을 생성하게 한다. 수렴 모드에서는 미적분 프레임을 적용해 방향을 잡고 결과로 수렴시킨다.
문제는 대부분의 워크플로우가 수렴 모드만 설계한다는 것이다. 프롬프트를 정밀하게 짜고, 체크포인트를 넣고, 피드백 루프를 설계한다. 그런데 "이 프롬프트가 올바른 질문을 던지고 있는가"를 점검하는 메타 레이어는 빠져 있다. 방향을 교정하는 시스템은 있지만, 지도를 교체하는 시스템은 없다.
실무에서 이것이 의미하는 것
하나, 파이프라인의 인간 체크포인트는 편의가 아니라 시스템 안정성의 문제다. 체크포인트 없는 긴 파이프라인은 개루프 제어다.
둘, 티키타카의 빈도는 태스크의 불확실성에 비례해야 한다. 잘 정의된 태스크는 저주파로, 모호한 태스크는 고주파 피드백이 필요하다.
셋, 인간 자신의 목적함수가 불완전하다는 걸 인정해야 한다. 중간 결과를 보면서 "내가 뭘 원하는지"를 발견하는 과정이 작업의 일부다.
넷, 에이전트에게 주는 메모리와 컨텍스트는 제어 시스템의 상태 변수다. 이전 피드백이 다음 실행에 반영되지 않으면, 매번 원점에서 시작하는 것과 같다.
다섯, "AI가 알아서 하게 두자"와 "사람이 다 확인해야 한다" 사이에 정답은 없다. 있는 것은 태스크의 성격에 따른 최적 샘플링 주파수뿐이다.
여섯, 수렴 이전에 탐색이 있다. AI와 일하는 첫 번째 질문은 "이걸 어떻게 시킬까"가 아니라 "이게 올바른 질문인가"다. AI는 새로운 컨텍스트를 스스로 찾아내지 못한다. 하지만 인간이 "저쪽을 봐"라고 방향을 틀면, 그 방향 안에서의 패턴 탐색은 인간보다 빠르고 넓다.
일곱, 가장 생산적인 AI 활용은 탐색과 수렴을 오가는 리듬에 있다. 넓게 펼치고, 감각을 잡고, 방향을 정하고, 수렴시키고, 막히면 다시 넓힌다. 이 리듬을 의식적으로 설계하는 것이 워크플로우의 핵심이다.
경로를 제어하고, 때로는 지도를 바꾸는 사람들
AI 시대의 일은 정답을 생성하는 것이 아니다. 경로를 제어하는 것이다. 그리고 때로는 경로가 그려진 지도 자체를 바꾸는 것이다.
에이전트는 빠르게 달린다. 하지만 어디로 달려야 하는지는 매 순간 조금씩 바뀐다. 인간의 역할은 그 "조금씩"을 읽고, 교정하고, 누적시켜 결과로 만드는 것이다. 미분으로 방향을 읽고, 적분으로 결과를 만든다.
그러나 더 근본적인 인간의 역할이 있다. "이 지도가 맞는가"를 묻는 것. AI는 주어진 좌표계 안에서 경로를 최적화하는 데는 탁월하지만, 좌표계 자체를 의심하지는 않는다. 새로운 좌표계를 설정하는 건 — 적어도 지금은 — 인간의 몫이다.
완벽한 출발점은 없다. 완벽한 프롬프트도 없다. 올바른 질문조차 처음부터 주어지지 않는다. 있는 것은 좋은 피드백 루프, 그리고 때때로 지도를 바꿀 용기뿐이다.
한 문장 요약: AI에게 일을 시키는 건 미분(방향 읽기)이고, 원하는 결과를 얻는 건 적분(수정의 누적)이다 — 단, 미적분이 작동하려면 먼저 올바른 지도 위에 서 있어야 하고, 그 지도를 선택하는 건 아직 인간의 일이다.
🔗 Sources
| # | 출처 | URL |
|---|---|---|
| 1 | Nyquist–Shannon Sampling Theorem — Wikipedia | 적절한 샘플링 주파수에 대한 신호처리 이론 |
| 2 | Human-in-the-loop — Wikipedia | 인간 피드백 루프 기반 시스템 설계 개념 |
| 3 | Gradient Descent — Wikipedia | 경사하강법 — 기울기를 따라 최적점으로 수렴하는 최적화 기법 |
| 4 | Control Theory — Wikipedia | 피드백 제어 루프와 동역학 시스템 이론 |
📚 이런 칼럼은 어떠세요?
공유하기
