홈
카테고리
태그
아카이브
정보

홈 아카이브

아카이브

아카이브

2025

15 / 02 HydraLoRA, An Asymmetric LoRA Architecture for Efficient Fine-Tuning

2024

30 / 09 GQA, Training Generalized Multi Query Transformer Models from Multi Head Checkpoints
01 / 08 Foundational Autoraters, Taming Large Language Models for Better Automatic Evaluation
17 / 07 Chain-of-verification Reduces Hallucination in Large Language Models
04 / 07 DoRA, Weight-Decomposed Low-Rank Adaptation
17 / 06 MART, Improving LLM Safety with Multi-round Automatic Red-Teaming
11 / 06 Generative Agents, Interactive Simulacra of Human Behavior
10 / 06 Iterative Reasoning Preference Optimization

최근 업데이트

HydraLoRA, An Asymmetric LoRA Architecture for Efficient Fine-Tuning
GQA, Training Generalized Multi Query Transformer Models from Multi Head Checkpoints
Foundational Autoraters, Taming Large Language Models for Better Automatic Evaluation
Chain-of-verification Reduces Hallucination in Large Language Models
DoRA, Weight-Decomposed Low-Rank Adaptation

인기 태그

LLM Factuality Peft DecisionMaking DPO Evaluation LoRA Optimization Transformer

© 2026 Minkyu Kim. 일부 권리 보유

Powered by Jekyll with Chirpy theme

인기 태그

LLM Factuality Peft DecisionMaking DPO Evaluation LoRA Optimization Transformer

새 버전의 콘텐츠를 사용할 수 있습니다.