|
|
9 tháng trước cách đây | |
|---|---|---|
| .. | ||
| scores | 1 năm trước cách đây | |
| README.md | 1 năm trước cách đây | |
| config.json | 1 năm trước cách đây | |
| eval-example-data.json | 1 năm trước cách đây | |
| llm-instruction-eval-ollama.ipynb | 1 năm trước cách đây | |
| llm-instruction-eval-openai.ipynb | 9 tháng trước cách đây | |
| requirements-extra.txt | 1 năm trước cách đây | |
This folder contains utility code that can be used for model evaluation.
The llm-instruction-eval-openai.ipynb notebook uses OpenAI's GPT-4 to evaluate responses generated by instruction finetuned models. It works with a JSON file in the following format:
{
"instruction": "What is the atomic number of helium?",
"input": "",
"output": "The atomic number of helium is 2.", # <-- The target given in the test set
"model 1 response": "\nThe atomic number of helium is 2.0.", # <-- Response by an LLM
"model 2 response": "\nThe atomic number of helium is 3." # <-- Response by a 2nd LLM
},