Evaluating Robustness in LLM-Based Medical Chatbots - AI for Social Impact - Wadhwani AI

Accepted | Workshop Paper (10 pages) | CHI-25 Workshop — Human-Centered Evaluation and Auditing of Language Models