LLM API를 호출해서 답변을 받는 건 쉽다. 하지만 agent를 만들려면 구조가 달라진다. 핵심은 LLM이 tool을 호출하고, 그 결과를 다시 받아서 판단하는 루프를 만드는 것이다. 이 글에서는 Claude API 기반으로 실제 동작하는 agent를 처음부터 설계하는 방법을 정리한다.
LLM API를 서비스에 붙이려면 가장 먼저 부딪히는 게 비용이다. 모델마다 가격 차이가 크고, 같은 회사 안에서도 tier가 나뉘어 있어서 한눈에 비교하기 어렵다. 이 글에서는 2026년 3월 기준 주요 LLM API의 가격을 정리하고, 실무에서 어떻게 조합해야 비용을 아낄 수 있는지 정리한다.
ToothFairy2는 치과용 CT(CBCT) 데이터를 42개 class로 voxel 단위 annotate한 대규모 공개 dataset이다. annotation refinement에 α-shape를 쓴다거나, nnU-Net의 data augmentation 하나를 제거하는 것만으로 DSC가 +10 오른다는 결과가 실용적인 관점에서 인상적이다.
Depth Anything 시리즈의 세 번째 논문, Depth Anything 3 (DA3) 리뷰다. 이전 시리즈가 monocular depth estimation에 집중했다면, DA3는 거기서 한 발 더 나아가 pose estimation, 3D reconstruction, novel view synthesis까지 단일 모델로 통합하는 것을 목표로 한다.