Cách chạy đánh giá trong giao diện người dùng LangSmith

Tác giả: LangChain
Ngày xuất bản: 2025-04-10T00:00:00
Length: 08:18

Tóm tắt nội dung

Mô tả

Roles like product managers or subject matter experts typically have the most context on the quality and performance of an LLM application, and thus can play a crucial role in leading the evaluation and improving AI applications.

In this video, we will show you how a LangSmith user, like PM or subject matter expert, can walk through the evaluation flow in the LangSmith UI.

0:00 - Introduction

0:39 - Steps to Running an Offline Evaluation

1:38 - Creating a Prompt

2:43 - Creating a Dataset

3:30 - Defining Evaluators

6:50 - Running & Visualizing an Experiment

Dịch Vào Lúc: 2025-04-13T03:16:43Z

Yêu cầu dịch (Một bản dịch khoảng 5 phút)

Phiên bản 3 (ổn định)

Tối ưu hóa cho một người nói. Phù hợp cho video chia sẻ kiến thức hoặc giảng dạy.

Video Đề Xuất