Tinh chỉnh Mô hình Thị giác GPT-4o: Hình ảnh Tùy chỉnh & Định dạng Đầu ra

vie v3

Nguồn: https://www.youtube.com/watch?v=-ByqbLyfFoo

Tác giả: Hands-on AI

Ngày xuất bản: 2024-10-03T00:00:00

Length: 13:02

Tóm tắt nội dung

Mô tả

Code: https://github.com/KannamSridharKumar/youtube_misc/blob/main/finetune_gpt_4o_vision.ipynb

Summary:

- The video explains how to fine-tune GPT-4 Vision with custom images and output formats, focusing on preparing the training data in JSON-L format and the ease of using OpenAI's standardized API.

- Preparing training data, especially annotating images and encoding them in Base64, is the most challenging step, but once done, the fine-tuning process is straightforward.

- The video demonstrates how to assess car damage from images for insurance purposes, identifying damaged parts, damage type, and severity using fine-tuned GPT-4 Vision.

Keywords:

GPT-4 Vision

Fine-tuning

OpenAI API

Computer Vision

Car damage assessment

Multimodal model

Training data preparation

Base64 encoding

#datascience #machinelearning #deeplearning #datanalytics #predictiveanalytics #artificialintelligence #generativeai #largelanguagemodels #computervision #naturallanguageprocessing #agents #transformers #embedding #graphml #graphdatascience #datavisualization #businessintelligence #optimization #montecarlosimulation #simulation #LLMs #python #aws #azure #gcp