-
Notifications
You must be signed in to change notification settings - Fork 353
Provide a cleaner progress bar when running evaluators in parallel #38
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Conversation
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Pull Request Overview
This PR aims to improve the clarity of progress reporting when evaluators run in parallel by introducing a simple tqdm position registry and integrating it across multiple evaluator modules.
- Added TqdmPositionRegistry to manage progress bar positions.
- Updated trajectory and RAG evaluators to use the registry for clearer progress display.
- Wrapped workflow execution with progress bar updates for overall evaluation tasks.
Reviewed Changes
Copilot reviewed 4 out of 4 changed files in this pull request and generated 1 comment.
File | Description |
---|---|
src/aiq/eval/utils/tqdm_position_registry.py | Introduces a registry to claim/release tqdm positions to avoid clashes. |
src/aiq/eval/trajectory_evaluator/evaluate.py | Uses the registry with a dedicated progress bar for trajectory evaluation. |
src/aiq/eval/rag_evaluator/evaluate.py | Integrates a dynamically positioned progress bar with registry support. |
src/aiq/eval/evaluate.py | Adds progress updates during workflow execution by wrapping evaluation calls. |
Comments suppressed due to low confidence (1)
src/aiq/eval/trajectory_evaluator/evaluate.py:66
- [nitpick] Consider revising the docstring in 'process_item' (lines 67-71) to remove the dangling hyphen after 'tuple of' for improved clarity.
async def process_item(item: EvalInputItem) -> tuple[float, dict]:
Maintain a simple position registry to separate and clearly display each evaluators progress. This is particularly needed if the dataset is large. Signed-off-by: Anuradha Karuppiah <anuradhak@nvidia.com>
Signed-off-by: Anuradha Karuppiah <anuradhak@nvidia.com>
Signed-off-by: Anuradha Karuppiah <anuradhak@nvidia.com>
89bc190
to
9e5f2c8
Compare
To use the position registry Signed-off-by: Anuradha Karuppiah <anuradhak@nvidia.com>
/merge |
…VIDIA#38) This PR aims to improve the clarity of progress reporting when evaluators run in parallel by introducing a simple tqdm position registry and integrating it across multiple evaluator modules. Added TqdmPositionRegistry to manage progress bar positions. Updated trajectory and RAG evaluators to use the registry for clearer progress display. Wrapped workflow execution with progress bar updates for overall evaluation tasks. ``` Evaluating Ragas nv_context_relevance: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 6/6 [00:11<00:00, 1.85s/it] Evaluating Ragas nv_response_groundedness: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 6/6 [00:12<00:00, 2.10s/it] Evaluating Ragas nv_accuracy: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 6/6 [00:13<00:00, 2.19s/it] Evaluating Trajectory: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 6/6 [00:12<00:00, 2.05s/it] ``` Authors: - Anuradha Karuppiah (https://github.com/AnuradhaKaruppiah) Approvers: - Yuchen Zhang (https://github.com/yczhang-nv) URL: NVIDIA#38
…VIDIA#38) This PR aims to improve the clarity of progress reporting when evaluators run in parallel by introducing a simple tqdm position registry and integrating it across multiple evaluator modules. Added TqdmPositionRegistry to manage progress bar positions. Updated trajectory and RAG evaluators to use the registry for clearer progress display. Wrapped workflow execution with progress bar updates for overall evaluation tasks. ``` Evaluating Ragas nv_context_relevance: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 6/6 [00:11<00:00, 1.85s/it] Evaluating Ragas nv_response_groundedness: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 6/6 [00:12<00:00, 2.10s/it] Evaluating Ragas nv_accuracy: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 6/6 [00:13<00:00, 2.19s/it] Evaluating Trajectory: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 6/6 [00:12<00:00, 2.05s/it] ``` Authors: - Anuradha Karuppiah (https://github.com/AnuradhaKaruppiah) Approvers: - Yuchen Zhang (https://github.com/yczhang-nv) URL: NVIDIA#38 Signed-off-by: Yuchen Zhang <134643420+yczhang-nv@users.noreply.github.com>
…VIDIA#38) This PR aims to improve the clarity of progress reporting when evaluators run in parallel by introducing a simple tqdm position registry and integrating it across multiple evaluator modules. Added TqdmPositionRegistry to manage progress bar positions. Updated trajectory and RAG evaluators to use the registry for clearer progress display. Wrapped workflow execution with progress bar updates for overall evaluation tasks. ``` Evaluating Ragas nv_context_relevance: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 6/6 [00:11<00:00, 1.85s/it] Evaluating Ragas nv_response_groundedness: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 6/6 [00:12<00:00, 2.10s/it] Evaluating Ragas nv_accuracy: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 6/6 [00:13<00:00, 2.19s/it] Evaluating Trajectory: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 6/6 [00:12<00:00, 2.05s/it] ``` Authors: - Anuradha Karuppiah (https://github.com/AnuradhaKaruppiah) Approvers: - Yuchen Zhang (https://github.com/yczhang-nv) URL: NVIDIA#38 Signed-off-by: Yuchen Zhang <134643420+yczhang-nv@users.noreply.github.com>
…VIDIA#38) This PR aims to improve the clarity of progress reporting when evaluators run in parallel by introducing a simple tqdm position registry and integrating it across multiple evaluator modules. Added TqdmPositionRegistry to manage progress bar positions. Updated trajectory and RAG evaluators to use the registry for clearer progress display. Wrapped workflow execution with progress bar updates for overall evaluation tasks. ``` Evaluating Ragas nv_context_relevance: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 6/6 [00:11<00:00, 1.85s/it] Evaluating Ragas nv_response_groundedness: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 6/6 [00:12<00:00, 2.10s/it] Evaluating Ragas nv_accuracy: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 6/6 [00:13<00:00, 2.19s/it] Evaluating Trajectory: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 6/6 [00:12<00:00, 2.05s/it] ``` Authors: - Anuradha Karuppiah (https://github.com/AnuradhaKaruppiah) Approvers: - Yuchen Zhang (https://github.com/yczhang-nv) URL: NVIDIA#38
…VIDIA#38) This PR aims to improve the clarity of progress reporting when evaluators run in parallel by introducing a simple tqdm position registry and integrating it across multiple evaluator modules. Added TqdmPositionRegistry to manage progress bar positions. Updated trajectory and RAG evaluators to use the registry for clearer progress display. Wrapped workflow execution with progress bar updates for overall evaluation tasks. ``` Evaluating Ragas nv_context_relevance: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 6/6 [00:11<00:00, 1.85s/it] Evaluating Ragas nv_response_groundedness: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 6/6 [00:12<00:00, 2.10s/it] Evaluating Ragas nv_accuracy: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 6/6 [00:13<00:00, 2.19s/it] Evaluating Trajectory: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 6/6 [00:12<00:00, 2.05s/it] ``` Authors: - Anuradha Karuppiah (https://github.com/AnuradhaKaruppiah) Approvers: - Yuchen Zhang (https://github.com/yczhang-nv) URL: NVIDIA#38
This PR aims to improve the clarity of progress reporting when evaluators run in parallel by introducing a simple tqdm position registry and integrating it across multiple evaluator modules.
Added TqdmPositionRegistry to manage progress bar positions.
Updated trajectory and RAG evaluators to use the registry for clearer progress display.
Wrapped workflow execution with progress bar updates for overall evaluation tasks.