Semanlink - ChatGPT: training ; RL from Human Feedback AND Slides

Printer friendly

Search Tag:

Search Doc:

Preferences...

Tag Cloud

ChatGPT - cs224n - Instruction tuning - Prompting/In-context learning - RL from Human Feedback - Slides -

ChatGPT: training ; RL from Human Feedback AND Slides

Common descendants

1 Document

Prompting, Instruction Finetuning, and RLHF (CS224N)

Tags:

2023-02-16 About