Queue Management for SLO-Oriented Large Language Model Serving
정민재 애기능생호관 301호 (Zoom 동시 송출)
본 세미나는 공개 세미나 형태로 진행됩니다. 논문의 원본은 저작권 문제로 공개할 수 없으며, 발표 당일 출력물로 제공해드립니다.
Coming Soon
현재 확정된 세미나 일정이 없습니다. 보통 매주 금요일 오후 7시 애기능 생활관 302호에서 진행됩니다.
Recent Seminars
-
Queue Management for SLO-Oriented Large Language Model Serving
정민재 애기능생호관 301호 (Zoom 동시 송출)
-
HIKU: Pull-Based Scheduling for Serverless Computing
김민창 애기능생호관 301호 (Zoom 동시 송출)
-
Hermes: Enhancing Layer-7 Cloud Load Balancers with Userspace-Directed I/O Event Notification
박호근 애기능생호관 304호 (Zoom 동시 송출)
-
Tiny Autoscalers for Tiny Workloads: Dynamic CPU Allocation for Serverless Functions
강태신 애기능생호관 301호 (Zoom 동시 송출)
-
Llumnix: Dynamic Scheduling for Large Language Model Serving
김형준 애기능생호관 301호 (Zoom 동시 송출)
-
Efficient LLM Scheduling by Learning to Rank
정민재 애기능생호관 301호 (Zoom 동시 송출)