Skip to content

Conversation

AnuradhaKaruppiah
Copy link
Contributor

@AnuradhaKaruppiah AnuradhaKaruppiah commented Mar 27, 2025

This PR aims to improve the clarity of progress reporting when evaluators run in parallel by introducing a simple tqdm position registry and integrating it across multiple evaluator modules.

Added TqdmPositionRegistry to manage progress bar positions.
Updated trajectory and RAG evaluators to use the registry for clearer progress display.
Wrapped workflow execution with progress bar updates for overall evaluation tasks.

Evaluating Ragas nv_context_relevance: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 6/6 [00:11<00:00,  1.85s/it]
Evaluating Ragas nv_response_groundedness: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 6/6 [00:12<00:00,  2.10s/it]
Evaluating Ragas nv_accuracy: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 6/6 [00:13<00:00,  2.19s/it]
Evaluating Trajectory: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 6/6 [00:12<00:00,  2.05s/it]

Copy link
Contributor

@Copilot Copilot AI left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Pull Request Overview

This PR aims to improve the clarity of progress reporting when evaluators run in parallel by introducing a simple tqdm position registry and integrating it across multiple evaluator modules.

  • Added TqdmPositionRegistry to manage progress bar positions.
  • Updated trajectory and RAG evaluators to use the registry for clearer progress display.
  • Wrapped workflow execution with progress bar updates for overall evaluation tasks.

Reviewed Changes

Copilot reviewed 4 out of 4 changed files in this pull request and generated 1 comment.

File Description
src/aiq/eval/utils/tqdm_position_registry.py Introduces a registry to claim/release tqdm positions to avoid clashes.
src/aiq/eval/trajectory_evaluator/evaluate.py Uses the registry with a dedicated progress bar for trajectory evaluation.
src/aiq/eval/rag_evaluator/evaluate.py Integrates a dynamically positioned progress bar with registry support.
src/aiq/eval/evaluate.py Adds progress updates during workflow execution by wrapping evaluation calls.
Comments suppressed due to low confidence (1)

src/aiq/eval/trajectory_evaluator/evaluate.py:66

  • [nitpick] Consider revising the docstring in 'process_item' (lines 67-71) to remove the dangling hyphen after 'tuple of' for improved clarity.
async def process_item(item: EvalInputItem) -> tuple[float, dict]:

Maintain a simple position registry to separate and clearly display
each evaluators progress. This is particularly needed if the dataset is
large.

Signed-off-by: Anuradha Karuppiah <anuradhak@nvidia.com>
Signed-off-by: Anuradha Karuppiah <anuradhak@nvidia.com>
Signed-off-by: Anuradha Karuppiah <anuradhak@nvidia.com>
@AnuradhaKaruppiah AnuradhaKaruppiah requested a review from a team as a code owner March 31, 2025 19:00
@AnuradhaKaruppiah AnuradhaKaruppiah added enhancement feature request New feature or request non-breaking Non-breaking change and removed enhancement labels Mar 31, 2025
To use the position registry

Signed-off-by: Anuradha Karuppiah <anuradhak@nvidia.com>
@AnuradhaKaruppiah
Copy link
Contributor Author

/merge

@rapids-bot rapids-bot bot merged commit af49653 into NVIDIA:develop Mar 31, 2025
3 checks passed
ericevans-nv pushed a commit to ericevans-nv/agent-iq that referenced this pull request Apr 14, 2025
…VIDIA#38)

This PR aims to improve the clarity of progress reporting when evaluators run in parallel by introducing a simple tqdm position registry and integrating it across multiple evaluator modules.

Added TqdmPositionRegistry to manage progress bar positions.
Updated trajectory and RAG evaluators to use the registry for clearer progress display.
Wrapped workflow execution with progress bar updates for overall evaluation tasks.
```
Evaluating Ragas nv_context_relevance: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 6/6 [00:11<00:00,  1.85s/it]
Evaluating Ragas nv_response_groundedness: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 6/6 [00:12<00:00,  2.10s/it]
Evaluating Ragas nv_accuracy: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 6/6 [00:13<00:00,  2.19s/it]
Evaluating Trajectory: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 6/6 [00:12<00:00,  2.05s/it]
```

Authors:
  - Anuradha Karuppiah (https://github.com/AnuradhaKaruppiah)

Approvers:
  - Yuchen Zhang (https://github.com/yczhang-nv)

URL: NVIDIA#38
yczhang-nv pushed a commit to yczhang-nv/NeMo-Agent-Toolkit that referenced this pull request Apr 21, 2025
…VIDIA#38)

This PR aims to improve the clarity of progress reporting when evaluators run in parallel by introducing a simple tqdm position registry and integrating it across multiple evaluator modules.

Added TqdmPositionRegistry to manage progress bar positions.
Updated trajectory and RAG evaluators to use the registry for clearer progress display.
Wrapped workflow execution with progress bar updates for overall evaluation tasks.
```
Evaluating Ragas nv_context_relevance: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 6/6 [00:11<00:00,  1.85s/it]
Evaluating Ragas nv_response_groundedness: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 6/6 [00:12<00:00,  2.10s/it]
Evaluating Ragas nv_accuracy: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 6/6 [00:13<00:00,  2.19s/it]
Evaluating Trajectory: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 6/6 [00:12<00:00,  2.05s/it]
```

Authors:
  - Anuradha Karuppiah (https://github.com/AnuradhaKaruppiah)

Approvers:
  - Yuchen Zhang (https://github.com/yczhang-nv)

URL: NVIDIA#38
Signed-off-by: Yuchen Zhang <134643420+yczhang-nv@users.noreply.github.com>
@AnuradhaKaruppiah AnuradhaKaruppiah deleted the tqdm-fixes branch May 6, 2025 00:48
yczhang-nv pushed a commit to yczhang-nv/NeMo-Agent-Toolkit that referenced this pull request May 8, 2025
…VIDIA#38)

This PR aims to improve the clarity of progress reporting when evaluators run in parallel by introducing a simple tqdm position registry and integrating it across multiple evaluator modules.

Added TqdmPositionRegistry to manage progress bar positions.
Updated trajectory and RAG evaluators to use the registry for clearer progress display.
Wrapped workflow execution with progress bar updates for overall evaluation tasks.
```
Evaluating Ragas nv_context_relevance: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 6/6 [00:11<00:00,  1.85s/it]
Evaluating Ragas nv_response_groundedness: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 6/6 [00:12<00:00,  2.10s/it]
Evaluating Ragas nv_accuracy: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 6/6 [00:13<00:00,  2.19s/it]
Evaluating Trajectory: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 6/6 [00:12<00:00,  2.05s/it]
```

Authors:
  - Anuradha Karuppiah (https://github.com/AnuradhaKaruppiah)

Approvers:
  - Yuchen Zhang (https://github.com/yczhang-nv)

URL: NVIDIA#38
Signed-off-by: Yuchen Zhang <134643420+yczhang-nv@users.noreply.github.com>
AnuradhaKaruppiah added a commit to AnuradhaKaruppiah/oss-agentiq that referenced this pull request Aug 4, 2025
…VIDIA#38)

This PR aims to improve the clarity of progress reporting when evaluators run in parallel by introducing a simple tqdm position registry and integrating it across multiple evaluator modules.

Added TqdmPositionRegistry to manage progress bar positions.
Updated trajectory and RAG evaluators to use the registry for clearer progress display.
Wrapped workflow execution with progress bar updates for overall evaluation tasks.
```
Evaluating Ragas nv_context_relevance: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 6/6 [00:11<00:00,  1.85s/it]
Evaluating Ragas nv_response_groundedness: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 6/6 [00:12<00:00,  2.10s/it]
Evaluating Ragas nv_accuracy: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 6/6 [00:13<00:00,  2.19s/it]
Evaluating Trajectory: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 6/6 [00:12<00:00,  2.05s/it]
```

Authors:
  - Anuradha Karuppiah (https://github.com/AnuradhaKaruppiah)

Approvers:
  - Yuchen Zhang (https://github.com/yczhang-nv)

URL: NVIDIA#38
scheckerNV pushed a commit to scheckerNV/aiq-factory-reset that referenced this pull request Aug 22, 2025
…VIDIA#38)

This PR aims to improve the clarity of progress reporting when evaluators run in parallel by introducing a simple tqdm position registry and integrating it across multiple evaluator modules.

Added TqdmPositionRegistry to manage progress bar positions.
Updated trajectory and RAG evaluators to use the registry for clearer progress display.
Wrapped workflow execution with progress bar updates for overall evaluation tasks.
```
Evaluating Ragas nv_context_relevance: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 6/6 [00:11<00:00,  1.85s/it]
Evaluating Ragas nv_response_groundedness: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 6/6 [00:12<00:00,  2.10s/it]
Evaluating Ragas nv_accuracy: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 6/6 [00:13<00:00,  2.19s/it]
Evaluating Trajectory: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 6/6 [00:12<00:00,  2.05s/it]
```

Authors:
  - Anuradha Karuppiah (https://github.com/AnuradhaKaruppiah)

Approvers:
  - Yuchen Zhang (https://github.com/yczhang-nv)

URL: NVIDIA#38
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
feature request New feature or request non-breaking Non-breaking change
Projects
None yet
Development

Successfully merging this pull request may close these issues.

2 participants