sentilens-ai-sentiment-analysis / enhanced_report_generator.py

Add enhanced_report_generator.py

8fb10d7 verified 2 months ago

27.3 kB

	#!/usr/bin/env python3
	"""
	SentilensAI - Enhanced Report Generator with Deep Learning Insights

	Generates comprehensive reports including deep learning analysis,
	learning recommendations, and actionable insights for agent training.

	Author: Pravin Selvamuthu
	"""

	import json
	import pandas as pd
	import numpy as np
	from datetime import datetime
	from typing import Dict, List, Any
	import matplotlib.pyplot as plt
	import seaborn as sns
	from collections import Counter, defaultdict
	import logging

	from enhanced_analysis import EnhancedSentimentAnalyzer

	# Configure logging
	logging.basicConfig(level=logging.INFO)
	logger = logging.getLogger(__name__)

	class EnhancedReportGenerator:
	"""Generate comprehensive reports with deep learning insights"""

	def __init__(self):
	self.analyzer = EnhancedSentimentAnalyzer()
	self.report_data = {}

	def generate_comprehensive_report(self, conversations: List[Dict[str, Any]]) -> Dict[str, Any]:
	"""Generate comprehensive report with deep learning analysis"""

	print("🤖 SentilensAI - Generating Enhanced Comprehensive Report")
	print("=" * 70)

	# Analyze all conversations with enhanced methods
	enhanced_analyses = []
	for conv in conversations:
	print(f"🔍 Analyzing {conv['conversation_id']} with deep learning...")
	enhanced_analysis = self.analyzer.analyze_conversation_enhanced(conv)
	enhanced_analyses.append(enhanced_analysis)

	# Generate comprehensive report
	report = {
	'report_metadata': {
	'generated_at': datetime.now().isoformat(),
	'total_conversations': len(conversations),
	'analysis_methods': ['Traditional ML', 'Deep Learning', 'Ensemble'],
	'report_version': '2.0.0'
	},
	'executive_summary': self._generate_executive_summary(enhanced_analyses),
	'deep_learning_insights': self._generate_deep_learning_insights(enhanced_analyses),
	'learning_recommendations': self._generate_learning_recommendations(enhanced_analyses),
	'quality_analysis': self._generate_quality_analysis(enhanced_analyses),
	'improvement_roadmap': self._generate_improvement_roadmap(enhanced_analyses),
	'technical_insights': self._generate_technical_insights(enhanced_analyses),
	'conversation_details': enhanced_analyses
	}

	return report

	def _generate_executive_summary(self, analyses: List[Dict[str, Any]]) -> Dict[str, Any]:
	"""Generate executive summary with key insights"""

	# Calculate overall metrics
	total_conversations = len(analyses)
	quality_scores = [analysis['quality_metrics']['overall_quality_score'] for analysis in analyses]
	avg_quality = np.mean(quality_scores)

	# Categorize conversations
	high_quality = sum(1 for score in quality_scores if score > 0.7)
	medium_quality = sum(1 for score in quality_scores if 0.4 <= score <= 0.7)
	low_quality = sum(1 for score in quality_scores if score < 0.4)

	# Deep learning metrics
	ensemble_benefits = []
	model_agreements = []
	prediction_confidences = []

	for analysis in analyses:
	dl_insights = analysis['deep_learning_insights']
	ensemble_benefits.append(dl_insights['deep_learning_insights']['ensemble_benefit'])
	model_agreements.append(dl_insights['model_agreement_analysis']['average_agreement'])
	prediction_confidences.append(dl_insights['deep_learning_insights']['prediction_confidence'])

	avg_ensemble_benefit = np.mean(ensemble_benefits)
	avg_model_agreement = np.mean(model_agreements)
	avg_prediction_confidence = np.mean(prediction_confidences)

	return {
	'overall_performance': {
	'average_quality_score': avg_quality,
	'quality_distribution': {
	'high_quality': high_quality,
	'medium_quality': medium_quality,
	'low_quality': low_quality
	},
	'performance_grade': self._calculate_performance_grade(avg_quality)
	},
	'deep_learning_metrics': {
	'ensemble_benefit': avg_ensemble_benefit,
	'model_agreement': avg_model_agreement,
	'prediction_confidence': avg_prediction_confidence,
	'ai_readiness_score': self._calculate_ai_readiness_score(
	avg_ensemble_benefit, avg_model_agreement, avg_prediction_confidence
	)
	},
	'key_insights': self._generate_key_insights(analyses),
	'critical_issues': self._identify_critical_issues(analyses),
	'success_factors': self._identify_success_factors(analyses)
	}

	def _calculate_performance_grade(self, avg_quality: float) -> str:
	"""Calculate performance grade based on quality score"""
	if avg_quality >= 0.8:
	return 'A+ (Excellent)'
	elif avg_quality >= 0.7:
	return 'A (Very Good)'
	elif avg_quality >= 0.6:
	return 'B (Good)'
	elif avg_quality >= 0.5:
	return 'C (Average)'
	else:
	return 'D (Needs Improvement)'

	def _calculate_ai_readiness_score(self, ensemble_benefit: float, model_agreement: float,
	prediction_confidence: float) -> float:
	"""Calculate AI readiness score"""
	return (ensemble_benefit * 0.4 + model_agreement * 0.3 + prediction_confidence * 0.3)

	def _generate_key_insights(self, analyses: List[Dict[str, Any]]) -> List[str]:
	"""Generate key insights from analysis"""
	insights = []

	# Calculate metrics
	quality_scores = [analysis['quality_metrics']['overall_quality_score'] for analysis in analyses]
	avg_quality = np.mean(quality_scores)

	ensemble_benefits = [analysis['deep_learning_insights']['deep_learning_insights']['ensemble_benefit']
	for analysis in analyses]
	avg_ensemble_benefit = np.mean(ensemble_benefits)

	# Generate insights
	if avg_quality > 0.7:
	insights.append("High overall conversation quality indicates effective agent training")
	elif avg_quality < 0.5:
	insights.append("Low conversation quality suggests need for comprehensive training overhaul")

	if avg_ensemble_benefit > 0.8:
	insights.append("Strong ensemble benefit indicates effective use of multiple AI models")
	elif avg_ensemble_benefit < 0.6:
	insights.append("Limited ensemble benefit suggests need for model optimization")

	# Count improvement opportunities
	total_opportunities = sum(len(analysis['improvement_opportunities']) for analysis in analyses)
	if total_opportunities > len(analyses) * 2:
	insights.append("Multiple improvement opportunities identified across conversations")

	return insights

	def _identify_critical_issues(self, analyses: List[Dict[str, Any]]) -> List[Dict[str, Any]]:
	"""Identify critical issues requiring immediate attention"""
	critical_issues = []

	for analysis in analyses:
	conv_id = analysis['conversation_id']
	quality_metrics = analysis['quality_metrics']

	# Check for critical quality issues
	if quality_metrics['negative_response_rate'] > 0.2:
	critical_issues.append({
	'conversation_id': conv_id,
	'issue': 'High negative response rate',
	'severity': 'CRITICAL',
	'description': f"Negative response rate: {quality_metrics['negative_response_rate']:.2f}",
	'action_required': 'Immediate tone checking implementation'
	})

	if quality_metrics['average_confidence'] < 0.4:
	critical_issues.append({
	'conversation_id': conv_id,
	'issue': 'Very low confidence scores',
	'severity': 'HIGH',
	'description': f"Average confidence: {quality_metrics['average_confidence']:.2f}",
	'action_required': 'Confidence improvement training'
	})

	if quality_metrics['model_agreement_rate'] < 0.5:
	critical_issues.append({
	'conversation_id': conv_id,
	'issue': 'Poor model agreement',
	'severity': 'MEDIUM',
	'description': f"Model agreement: {quality_metrics['model_agreement_rate']:.2f}",
	'action_required': 'Ensemble optimization'
	})

	return critical_issues

	def _identify_success_factors(self, analyses: List[Dict[str, Any]]) -> List[Dict[str, Any]]:
	"""Identify success factors from high-performing conversations"""
	success_factors = []

	# Find high-quality conversations
	high_quality_convs = [analysis for analysis in analyses
	if analysis['quality_metrics']['overall_quality_score'] > 0.7]

	if high_quality_convs:
	# Analyze common patterns
	high_confidence_count = sum(1 for conv in high_quality_convs
	if conv['quality_metrics']['average_confidence'] > 0.7)

	if high_confidence_count > 0:
	success_factors.append({
	'factor': 'High Confidence Responses',
	'description': f"{high_confidence_count} high-quality conversations had high confidence",
	'recommendation': 'Replicate confidence-building techniques'
	})

	# Check for positive sentiment trends
	positive_trend_count = 0
	for conv in high_quality_convs:
	user_sentiments = conv['deep_learning_insights']['sentiment_evolution']['user_trend']
	if len(user_sentiments) >= 2 and user_sentiments[-1] == 'positive':
	positive_trend_count += 1

	if positive_trend_count > 0:
	success_factors.append({
	'factor': 'Positive Sentiment Management',
	'description': f"{positive_trend_count} conversations successfully maintained positive sentiment",
	'recommendation': 'Document and train on positive sentiment techniques'
	})

	return success_factors

	def _generate_deep_learning_insights(self, analyses: List[Dict[str, Any]]) -> Dict[str, Any]:
	"""Generate deep learning specific insights"""

	# Aggregate deep learning metrics
	all_ensemble_benefits = []
	all_model_agreements = []
	all_prediction_confidences = []
	all_model_diversities = []

	for analysis in analyses:
	dl_insights = analysis['deep_learning_insights']['deep_learning_insights']
	all_ensemble_benefits.append(dl_insights['ensemble_benefit'])
	all_model_agreements.append(analysis['deep_learning_insights']['model_agreement_analysis']['average_agreement'])
	all_prediction_confidences.append(dl_insights['prediction_confidence'])
	all_model_diversities.append(dl_insights['model_diversity'])

	return {
	'ensemble_performance': {
	'average_benefit': np.mean(all_ensemble_benefits),
	'benefit_consistency': 1.0 - np.std(all_ensemble_benefits),
	'recommendation': self._get_ensemble_recommendation(np.mean(all_ensemble_benefits))
	},
	'model_agreement_analysis': {
	'average_agreement': np.mean(all_model_agreements),
	'agreement_consistency': 1.0 - np.std(all_model_agreements),
	'disagreement_rate': sum(1 for agree in all_model_agreements if agree < 0.7) / len(all_model_agreements)
	},
	'prediction_confidence': {
	'average_confidence': np.mean(all_prediction_confidences),
	'confidence_consistency': 1.0 - np.std(all_prediction_confidences),
	'low_confidence_rate': sum(1 for conf in all_prediction_confidences if conf < 0.6) / len(all_prediction_confidences)
	},
	'model_diversity': {
	'average_diversity': np.mean(all_model_diversities),
	'diversity_consistency': 1.0 - np.std(all_model_diversities),
	'recommendation': self._get_diversity_recommendation(np.mean(all_model_diversities))
	},
	'ai_optimization_opportunities': self._identify_ai_optimization_opportunities(analyses)
	}

	def _get_ensemble_recommendation(self, avg_benefit: float) -> str:
	"""Get ensemble recommendation based on benefit score"""
	if avg_benefit > 0.8:
	return "Excellent ensemble performance - maintain current configuration"
	elif avg_benefit > 0.6:
	return "Good ensemble performance - consider fine-tuning weights"
	else:
	return "Poor ensemble performance - implement better model selection and weighting"

	def _get_diversity_recommendation(self, avg_diversity: float) -> str:
	"""Get diversity recommendation based on diversity score"""
	if avg_diversity > 0.8:
	return "High model diversity - good for robust predictions"
	elif avg_diversity > 0.6:
	return "Moderate diversity - consider adding more model types"
	else:
	return "Low diversity - add more diverse models to ensemble"

	def _identify_ai_optimization_opportunities(self, analyses: List[Dict[str, Any]]) -> List[Dict[str, Any]]:
	"""Identify AI optimization opportunities"""
	opportunities = []

	# Analyze model performance patterns
	low_confidence_convs = [analysis for analysis in analyses
	if analysis['quality_metrics']['average_confidence'] < 0.6]

	if len(low_confidence_convs) > len(analyses) * 0.3:
	opportunities.append({
	'area': 'Model Confidence',
	'issue': 'Widespread low confidence predictions',
	'solution': 'Implement confidence calibration and model fine-tuning',
	'priority': 'High',
	'expected_impact': 'Significant improvement in prediction reliability'
	})

	# Analyze ensemble effectiveness
	low_agreement_convs = [analysis for analysis in analyses
	if analysis['quality_metrics']['model_agreement_rate'] < 0.7]

	if len(low_agreement_convs) > len(analyses) * 0.4:
	opportunities.append({
	'area': 'Model Agreement',
	'issue': 'Poor model agreement across conversations',
	'solution': 'Implement consensus mechanisms and model selection strategies',
	'priority': 'Medium',
	'expected_impact': 'Improved prediction consistency'
	})

	return opportunities

	def _generate_learning_recommendations(self, analyses: List[Dict[str, Any]]) -> Dict[str, Any]:
	"""Generate comprehensive learning recommendations"""

	# Aggregate recommendations from all conversations
	all_immediate_actions = []
	all_short_term_improvements = []
	all_long_term_strategies = []
	all_technical_recommendations = []

	for analysis in analyses:
	recommendations = analysis['learning_recommendations']
	all_immediate_actions.extend(recommendations['immediate_actions'])
	all_short_term_improvements.extend(recommendations['short_term_improvements'])
	all_long_term_strategies.extend(recommendations['long_term_strategy'])
	all_technical_recommendations.extend(recommendations['technical_recommendations'])

	# Consolidate and prioritize recommendations
	consolidated_recommendations = {
	'immediate_actions': self._consolidate_recommendations(all_immediate_actions),
	'short_term_improvements': self._consolidate_recommendations(all_short_term_improvements),
	'long_term_strategies': self._consolidate_recommendations(all_long_term_strategies),
	'technical_recommendations': self._consolidate_recommendations(all_technical_recommendations),
	'learning_priorities': self._generate_learning_priorities(analyses),
	'training_roadmap': self._generate_training_roadmap(analyses)
	}

	return consolidated_recommendations

	def _consolidate_recommendations(self, recommendations: List[Dict[str, Any]]) -> List[Dict[str, Any]]:
	"""Consolidate similar recommendations and remove duplicates"""
	consolidated = []
	seen_actions = set()

	for rec in recommendations:
	action_key = rec.get('action', rec.get('recommendation', '')).lower()
	if action_key not in seen_actions:
	consolidated.append(rec)
	seen_actions.add(action_key)

	return consolidated

	def _generate_learning_priorities(self, analyses: List[Dict[str, Any]]) -> Dict[str, Any]:
	"""Generate learning priorities based on analysis"""

	# Count critical issues
	critical_issues = self._identify_critical_issues(analyses)
	issue_counts = Counter(issue['issue'] for issue in critical_issues)

	priorities = {
	'critical': list(issue_counts.keys())[:3], # Top 3 critical issues
	'high_impact_areas': [
	'Response Confidence',
	'Sentiment Management',
	'Model Agreement'
	],
	'training_focus': [
	'Deep Learning Integration',
	'Ensemble Optimization',
	'Confidence Calibration'
	]
	}

	return priorities

	def _generate_training_roadmap(self, analyses: List[Dict[str, Any]]) -> Dict[str, Any]:
	"""Generate training roadmap with timelines"""

	return {
	'phase_1_immediate': {
	'timeline': '1-2 weeks',
	'focus': 'Critical issue resolution',
	'activities': [
	'Implement tone checking system',
	'Deploy confidence improvement training',
	'Set up real-time monitoring'
	]
	},
	'phase_2_short_term': {
	'timeline': '1-2 months',
	'focus': 'Deep learning optimization',
	'activities': [
	'Fine-tune transformer models',
	'Implement ensemble consensus',
	'Create training data pipeline'
	]
	},
	'phase_3_long_term': {
	'timeline': '3-6 months',
	'focus': 'Advanced AI capabilities',
	'activities': [
	'Develop custom domain models',
	'Implement active learning',
	'Create continuous improvement pipeline'
	]
	}
	}

	def _generate_quality_analysis(self, analyses: List[Dict[str, Any]]) -> Dict[str, Any]:
	"""Generate quality analysis with deep learning insights"""

	quality_scores = [analysis['quality_metrics']['overall_quality_score'] for analysis in analyses]
	confidence_scores = [analysis['quality_metrics']['average_confidence'] for analysis in analyses]
	agreement_scores = [analysis['quality_metrics']['model_agreement_rate'] for analysis in analyses]

	return {
	'overall_quality_metrics': {
	'average_quality_score': np.mean(quality_scores),
	'quality_consistency': 1.0 - np.std(quality_scores),
	'quality_distribution': {
	'excellent': sum(1 for score in quality_scores if score > 0.8),
	'good': sum(1 for score in quality_scores if 0.6 <= score <= 0.8),
	'average': sum(1 for score in quality_scores if 0.4 <= score < 0.6),
	'poor': sum(1 for score in quality_scores if score < 0.4)
	}
	},
	'confidence_analysis': {
	'average_confidence': np.mean(confidence_scores),
	'confidence_consistency': 1.0 - np.std(confidence_scores),
	'low_confidence_rate': sum(1 for conf in confidence_scores if conf < 0.6) / len(confidence_scores)
	},
	'model_agreement_analysis': {
	'average_agreement': np.mean(agreement_scores),
	'agreement_consistency': 1.0 - np.std(agreement_scores),
	'disagreement_rate': sum(1 for agree in agreement_scores if agree < 0.7) / len(agreement_scores)
	}
	}

	def _generate_improvement_roadmap(self, analyses: List[Dict[str, Any]]) -> Dict[str, Any]:
	"""Generate improvement roadmap with specific actions"""

	return {
	'immediate_improvements': {
	'timeline': '1-2 weeks',
	'actions': [
	'Deploy real-time tone checking',
	'Implement confidence monitoring',
	'Create quality alerts'
	],
	'expected_impact': 'Eliminate critical issues'
	},
	'short_term_improvements': {
	'timeline': '1-2 months',
	'actions': [
	'Optimize ensemble methods',
	'Improve model agreement',
	'Enhance training data quality'
	],
	'expected_impact': 'Significant quality improvement'
	},
	'long_term_improvements': {
	'timeline': '3-6 months',
	'actions': [
	'Develop custom AI models',
	'Implement active learning',
	'Create continuous improvement pipeline'
	],
	'expected_impact': 'Industry-leading performance'
	}
	}

	def _generate_technical_insights(self, analyses: List[Dict[str, Any]]) -> Dict[str, Any]:
	"""Generate technical insights and recommendations"""

	return {
	'model_performance': {
	'ensemble_effectiveness': 'High' if np.mean([a['deep_learning_insights']['deep_learning_insights']['ensemble_benefit']
	for a in analyses]) > 0.7 else 'Medium',
	'model_diversity': 'Good' if np.mean([a['deep_learning_insights']['deep_learning_insights']['model_diversity']
	for a in analyses]) > 0.7 else 'Needs Improvement',
	'prediction_reliability': 'High' if np.mean([a['quality_metrics']['model_agreement_rate']
	for a in analyses]) > 0.7 else 'Medium'
	},
	'infrastructure_recommendations': [
	'Deploy scalable model serving infrastructure',
	'Implement real-time monitoring and alerting',
	'Create automated model retraining pipeline',
	'Set up A/B testing for model improvements'
	],
	'data_quality_insights': {
	'training_data_adequacy': 'Sufficient' if len(analyses) > 10 else 'Insufficient',
	'data_diversity': 'Good' if len(set(a['conversation_id'] for a in analyses)) > 5 else 'Limited',
	'quality_consistency': 'High' if np.std([a['quality_metrics']['overall_quality_score'] for a in analyses]) < 0.2 else 'Variable'
	}
	}

	def save_report(self, report: Dict[str, Any], filename: str = None) -> str:
	"""Save comprehensive report to file"""

	if filename is None:
	timestamp = datetime.now().strftime('%Y%m%d_%H%M%S')
	filename = f"enhanced_sentiment_report_{timestamp}.json"

	with open(filename, 'w', encoding='utf-8') as f:
	json.dump(report, f, indent=2, ensure_ascii=False)

	logger.info(f"Enhanced report saved to: {filename}")
	return filename

	def main():
	"""Demo function for enhanced report generation"""
	print("🤖 SentilensAI - Enhanced Report Generator Demo")
	print("=" * 60)

	# Load sample conversations
	import glob
	result_files = glob.glob("sentiment_analysis_results_*.json")
	if not result_files:
	print("❌ No analysis results found!")
	return

	latest_file = max(result_files)
	with open(latest_file, 'r', encoding='utf-8') as f:
	results = json.load(f)

	# Convert to conversation format
	conversations = []
	for conv in results['conversation_results']:
	conversation = {
	'conversation_id': conv['conversation_id'],
	'timestamp': conv['timestamp'],
	'messages': []
	}

	for msg in conv['message_analysis']:
	conversation['messages'].append({
	'user': msg['user_message'],
	'bot': msg['bot_message'],
	'timestamp': msg['timestamp']
	})

	conversations.append(conversation)

	# Generate enhanced report
	generator = EnhancedReportGenerator()
	report = generator.generate_comprehensive_report(conversations)

	# Save report
	filename = generator.save_report(report)

	# Display summary
	print(f"\n📊 Enhanced Report Summary:")
	print(f" Total Conversations: {report['report_metadata']['total_conversations']}")
	print(f" Average Quality Score: {report['executive_summary']['overall_performance']['average_quality_score']:.2f}")
	print(f" Performance Grade: {report['executive_summary']['overall_performance']['performance_grade']}")
	print(f" AI Readiness Score: {report['executive_summary']['deep_learning_metrics']['ai_readiness_score']:.2f}")

	print(f"\n🎓 Learning Recommendations:")
	print(f" Immediate Actions: {len(report['learning_recommendations']['immediate_actions'])}")
	print(f" Short-term Improvements: {len(report['learning_recommendations']['short_term_improvements'])}")
	print(f" Long-term Strategies: {len(report['learning_recommendations']['long_term_strategies'])}")

	print(f"\n💾 Report saved to: {filename}")
	print(f"\n✅ Enhanced report generation completed!")
	print(f"🚀 Deep learning insights and recommendations ready!")

	if __name__ == "__main__":
	main()