Apr 25

•

오류에 대한 원인을 찾을 수 있을까요?
video 파일이 없다고 해서 넣어주긴 했는데, 그것 때문일까요?
3초가량의 video 이고, 그 구문을 주석 처리 후에도 같은 에러가 발생합니다.
'''

That sounds like a fun challenge! Could you please provide me with a template or a specific scenario you'd like to use for this?<|im_end|><|endofturn|>

Both `max_new_tokens` (=8192) and `max_length`(=196) seem to have been set. `max_new_tokens` will take precedence. Please refer to the documentation for more information. (https://huggingface.co/docs/transformers/main/en/main_classes/text_generation)

RuntimeError Traceback (most recent call last)
Cell In[2], line 77
72 preprocessed = preprocessor(all_images, is_video_list=is_video_list)
73 input_ids = tokenizer.apply_chat_template(
74 new_vlm_chat, return_tensors="pt", tokenize=True, add_generation_prompt=True,
75 )
---> 77 output_ids = model.generate(
78 input_ids=input_ids.to(device="cuda"),
79 max_new_tokens=8192,
80 do_sample=True,
81 top_p=0.6,
82 temperature=0.5,
83 repetition_penalty=1.0,
84 **preprocessed,
85 )
86 print(tokenizer.batch_decode(output_ids)[0])

File /usr/local/lib/python3.9/dist-packages/torch/utils/_contextlib.py:116, in context_decorator..decorate_context(*args, **kwargs)
113 @functools.wraps(func)
114 def decorate_context(*args, **kwargs):
115 with ctx_factory():
--> 116 return func(*args, **kwargs)

File ~/.cache/huggingface/modules/transformers_modules/naver-hyperclovax/HyperCLOVAX-SEED-Vision-Instruct-3B/e9d93a47210f12fbee2b7b65f1561f37c872db2b/modeling_hyperclovax.py:1140, in HCXVisionForCausalLM.generate(self, input_ids, pixel_values, image_sizes, vision_query_lengths, non_vision_query_lengths, num_queries_vis_abstractors, num_queries_vis_abstractors_slow, first_last_frames_slows, is_videos, img_start_ids_list, pad_token_id, eos_token_id, bad_words_ids, max_length, min_length, do_sample, num_beams, top_p, top_k, temperature, repetition_penalty, length_penalty, use_cache, **kwargs)
1135 inputs_embeds = (
1136 inputs_embeds.to(self.base_model.device) if isinstance(inputs_embeds, torch.Tensor) else inputs_embeds
1137 )
1139 # pred : torch.int64 : [batchsize, generated token_length]
-> 1140 pred = self.language_model.generate(
1141 inputs_embeds=inputs_embeds,
1142 pad_token_id=pad_token_id,
1143 eos_token_id=eos_token_id,
1144 bad_words_ids=bad_words_ids,
1145 max_length=max_length,
1146 min_length=min_length,
1147 num_beams=num_beams,
1148 do_sample=(False if temperature == 0.0 else do_sample), # set do_sample=False if invalid temperature
1149 top_k=top_k,
1150 top_p=top_p,
1151 temperature=temperature,
1152 repetition_penalty=repetition_penalty,
1153 length_penalty=length_penalty,
1154 early_stopping=(False if num_beams <= 1 else True), # set early_stopping=False when not beam_search
1155 use_cache=use_cache,
1156 **kwargs,
1157 )
1159 return pred

File /usr/local/lib/python3.9/dist-packages/torch/utils/_contextlib.py:116, in context_decorator..decorate_context(*args, **kwargs)
113 @functools.wraps(func)
114 def decorate_context(*args, **kwargs):
115 with ctx_factory():
--> 116 return func(*args, **kwargs)

File /usr/local/lib/python3.9/dist-packages/transformers/generation/utils.py:2465, in GenerationMixin.generate(self, inputs, generation_config, logits_processor, stopping_criteria, prefix_allowed_tokens_fn, synced_gpus, assistant_model, streamer, negative_prompt_ids, negative_prompt_attention_mask, use_model_defaults, **kwargs)
2457 input_ids, model_kwargs = self._expand_inputs_for_generation(
2458 input_ids=input_ids,
2459 expand_size=generation_config.num_return_sequences,
2460 is_encoder_decoder=self.config.is_encoder_decoder,
2461 **model_kwargs,
2462 )
2464 # 12. run sample (it degenerates to greedy search when generation_config.do_sample=False)
-> 2465 result = self._sample(
2466 input_ids,
2467 logits_processor=prepared_logits_processor,
2468 stopping_criteria=prepared_stopping_criteria,
2469 generation_config=generation_config,
2470 synced_gpus=synced_gpus,
2471 streamer=streamer,
2472 **model_kwargs,
2473 )
2475 elif generation_mode in (GenerationMode.BEAM_SAMPLE, GenerationMode.BEAM_SEARCH):
2476 # 11. interleave input_ids with num_beams additional sequences per batch
2477 input_ids, model_kwargs = self._expand_inputs_for_generation(
2478 input_ids=input_ids,
2479 expand_size=generation_config.num_beams,
2480 is_encoder_decoder=self.config.is_encoder_decoder,
2481 **model_kwargs,
2482 )

File /usr/local/lib/python3.9/dist-packages/transformers/generation/utils.py:3431, in GenerationMixin._sample(self, input_ids, logits_processor, stopping_criteria, generation_config, synced_gpus, streamer, **model_kwargs)
3428 model_inputs.update({"output_hidden_states": output_hidden_states} if output_hidden_states else {})
3430 if is_prefill:
-> 3431 outputs = self(**model_inputs, return_dict=True)
3432 is_prefill = False
3433 else: