Qwen
/

Qwen3Guard-Gen-0.6B

Text Generation

text-generation-inference

Model card Files Files and versions

hzhwcmhf commited on 28 days ago

Commit

0a0af2c

·

verified ·

1 Parent(s): 5e11206

Update README.md

Files changed (1) hide show

README.md +2 -2

README.md CHANGED Viewed

@@ -45,7 +45,7 @@ model = AutoModelForCausalLM.from_pretrained(
 )
 def extract_label_and_categories(content):
     safe_pattern = r"Safety: (Safe|Unsafe|Controversial)"
-    category_pattern = r"(Violent|Non-violent Illegal Acts|Sexual Content or Sexual Acts|Suicide & Self-Harm|Unethical Acts|Politically Sensitive Topics|Copyright Violation|Jailbreak|None)"
     safe_label_match = re.search(safe_pattern, content)
     label = safe_label_match.group(1) if safe_label_match else None
     categories = re.findall(category_pattern, content)
@@ -97,7 +97,7 @@ model = AutoModelForCausalLM.from_pretrained(
 )
 def extract_label_categories_refusal(content):
     safe_pattern = r"Safety: (Safe|Unsafe|Controversial)"
-    category_pattern = r"(Violent|Non-violent Illegal Acts|Sexual Content or Sexual Acts|Suicide & Self-Harm|Unethical Acts|Politically Sensitive Topics|Copyright Violation|None)"
     refusal_pattern = r"Refusal: (Yes|No)"
     safe_label_match = re.search(safe_pattern, content)
     refusal_label_match = re.search(refusal_pattern, content)

 )
 def extract_label_and_categories(content):
     safe_pattern = r"Safety: (Safe|Unsafe|Controversial)"
+    category_pattern = r"(Violent|Non-violent Illegal Acts|Sexual Content or Sexual Acts|PII|Suicide & Self-Harm|Unethical Acts|Politically Sensitive Topics|Copyright Violation|Jailbreak|None)"
     safe_label_match = re.search(safe_pattern, content)
     label = safe_label_match.group(1) if safe_label_match else None
     categories = re.findall(category_pattern, content)
 )
 def extract_label_categories_refusal(content):
     safe_pattern = r"Safety: (Safe|Unsafe|Controversial)"
+    category_pattern = r"(Violent|Non-violent Illegal Acts|Sexual Content or Sexual Acts|PII|Suicide & Self-Harm|Unethical Acts|Politically Sensitive Topics|Copyright Violation|None)"
     refusal_pattern = r"Refusal: (Yes|No)"
     safe_label_match = re.search(safe_pattern, content)
     refusal_label_match = re.search(refusal_pattern, content)