Add qwen2 vl #308

khai-meetkai · 2025-01-17T02:59:14Z

No description provided.

musab-mk · 2025-02-03T15:03:23Z

functionary/train_vision/README.md

    --gradient_checkpointing True \
-    --packing False\
+    --packing True\
    --optim "paged_adamw_32bit" \


adamw_torch_fused would lower VRAM and higher throughput. Speed would increase significantly.

It will use BF16 per moment instead of 32 bit

khai-meetkai added 18 commits October 1, 2024 09:49

implement Lazy vision dataset

6e9dc6f

add manually test

bb6e570

implement qwen_vl_template

e2a8bf4

update code

bcb3915

fix masking in custom_dataset

cf9e61d

implement collate_fn for qwenvl2

d6acf3e

refactor vision dataset

36ad48d

implement packing for vl

471352d

fix bug in creating labels

9c0f0a6

fix the code for qwen2-vl

3acc0dd

add cached to loading data

35dc3cc

update training code

da7a280

fix vllm to support image=inputs

847fb93

update inference code for vllm

fc06b9d

merge from main

53451b8

fix template

56e49ba

add liger and add cache

74819b6

fix

3d86bad

khai-meetkai marked this pull request as draft January 17, 2025 02:59

khai-meetkai added 2 commits January 17, 2025 07:03

fix inference

349aaee

integrate qwen2.5

f2e2d0b

musab-mk requested changes Feb 3, 2025

View reviewed changes

khai-meetkai and others added 5 commits February 5, 2025 08:25

add qwen2.5 template

5dbb2e3

fix qwen25 template, also add to test

f04be99

add post process to remove emoji

97db96c

add streaming for qwen25

3b2e21e

implement tool_choice

c1d4439

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Add qwen2 vl #308

Add qwen2 vl #308

khai-meetkai commented Jan 17, 2025

musab-mk Feb 3, 2025

musab-mk Feb 3, 2025 •

edited

Loading

Add qwen2 vl #308

Are you sure you want to change the base?

Add qwen2 vl #308

Conversation

khai-meetkai commented Jan 17, 2025

musab-mk Feb 3, 2025

Choose a reason for hiding this comment

musab-mk Feb 3, 2025 • edited Loading

Choose a reason for hiding this comment

musab-mk Feb 3, 2025 •

edited

Loading