zero-few-shot-llm-classification

所属分类:聚类算法
开发工具:Jupyter Notebook
文件大小:0KB
下载次数:0
上传日期:2024-05-18 23:59:22
上 传 者sh-1993
说明:  zero few shot llm classification,, stars:0, update:2024-05-17 08:55:31

文件列表:
data/
LICENSE
Zero_few_shot_text_classification.ipynb

# zero-few-shot-llm-classification В данном исследовании мы оценивали производительность различных мо- делей, включая Mistral-7B и LLaMA-3-8B, в сценариях zero-shot, 5-shot и 10-shot на наборах данных RuSentiment, IMDB и Inappropriate Sensitive Topics. Наша цель заключалась в том, чтобы понять, как качество классификации зависит от количества примеров на класс, исследовать устойчивость моделей к замене примеров в промптах и определить влияние размера и архитектуры моделей на качество классификации. Результаты показали значительное улучшение precision, recall и F1-score с увеличением числа примеров. Модели хорошо справлялись с классификацией знакомых классов, таких как "Positive"и "Negative но испытывали трудности с менее знакомыми классами, такими как "Skip"и "Speech что указывает на необходимость большего объема данных и более глубокого обучения для этих категорий. Мы использовали квантизацию как способ оптимизации для экономии па- мяти и ускорения инференса, применяя 4-битную квантизацию BitsAndBytes для меньших моделей и 2-битную квантизацию AQLM для больших моделей. Наши результаты подчеркивают важность учета вычислительных затрат и потребностей в данных при выборе и настройке моделей. Хотя few-shot обу- чение улучшает производительность моделей для знакомых классов, для более сложных задач это может быть недостаточно без дальнейшей настройки или до- полнительного объема данных.

近期下载者

相关文件


收藏者