Introduction: Monitoring and Automations Essentials with LangSmith

LangChain
2 Apr 202403:39

Summary

TLDRハリソンがLang Chainの「Lang Smith」というLLMシステム運用プラットフォームの新機能について紹介します。このプラットフォームは、ログ記録、監視、デバッグ、テスト、評価を行い、特にプロダクションモニタリングと自動化に焦点を当てています。新機能として、効果的なフィルタリング体験、監視チャート、スレッドビュー、自動化オプションが追加されました。これらの機能を組み合わせて実際の問題を解決する方法について、詳細なビデオと実用例を通じて解説します。Lang SmithはLang Chainに依存しない独立したSaaSプラットフォームで、無料でアカウントを登録できます。

Takeaways

  • 📢 Lang SmithはLLMシステムのOpsプラットフォームで、ログ、監視、デバッグ、テスト、評価に利用できます。
  • 🚀 最近、Lang Smithに生産環境の監視と自動化に特化した新しい機能が追加されました。
  • 🔍 より多くのログを扱うことで、生产環境でのサブセットのフィルタリングが重要になりました。
  • 📊 監視チャートが追加され、アプリケーション全体の状況を集約的に把握できます。
  • 💬 チャットがLLアプリケーションの主要なUXの1つであるため、会話の異なるターンをグループ化し、スレッド全体を一目で確認できるビューが追加されました。
  • 🤖 自動化機能は、データのフィルタリングされたサブセットを自動的に処理する方法です。
  • 🔄 自動化を使用して、データセットやアノテーションキューに送信できます。
  • 📝 オンライン評価は、生産環境のトラフィックに対するランタイムの実行を自動的に評価し、フィードバックを提供する方法です。
  • 🎥 これらの機能について詳しく説明するビデオや、実際のユースケースを紹介するエンド 투 エンドのビデオが公開される予定です。
  • 💼 Lang SmithはChainを使用しているかどうかに関係なく、ログ、監視、テスト、評価を行うためのSaaSプラットフォームです。
  • 🔗 Lang Smithのアカウントを無料で登録するには、smith.chain.comにアクセスしてください。

Q & A

  • ランスミスとは何ですか?

    -ランスミスは、ロギング、監視、デバッグ、テスト、評価のためのLLM(Large Language Model)システム運用プラットフォームです。

  • ランスミスで新たに追加された機能は何ですか?

    -ランスミスで新たに追加された機能には、プロダクション監視と自動化に関する機能が含まれています。

  • プロダクションサービスでログが増えた場合、どのように対処しますか?

    -ランスミスでは、フィルタリング機能が強化されており、必要なサブセットに簡単にフィルタリングできます。

  • ランスミスの監視チャートは何ですか?

    -ランスミスの監視チャートは、アプリケーション内の状況を集約的に把握するための視覚的なツールです。

  • ランスミスで会話のスレッドを整理するにはどうすればよいですか?

    -ランスミスでは、会話の異なるターンをグループ化し、スレッドレベルでのビューを提供することで整理できます。

  • 自動化とは何ですか?

    -自動化とは、フィルタリングされたデータのサブセットを自動的に処理し、データセットに送信したり、注釈に使用したりすることができる機能です。

  • オンライン評価とは何ですか?

    -オンライン評価は、プロダクショントラフィックに入ってくるトレースの一部に対して、プロンプトを実行しフィードバックを残し、自動的に評価を行う機能です。

  • ランスミスを使用するためにはどのような条件が必要ですか?

    -ランスミスはLLMアプリケーションの運用に使用でき、ランチェーンを使用していなくても利用可能です。

  • ランスミスのアカウントを作成するにはどうすればよいですか?

    -ランスミスのアカウントを作成するには、smith.chain.comにアクセスし、無料アカウントを作成できます。

  • ランスミスで提供される詳細なビデオとは何ですか?

    -ランスミスでは、新機能に関する詳細なビデオだけでなく、これらの機能を組み合わせて実際の問題に適用する方法についてのエンドツーエンドのユースケースビデオも提供されます。

  • ランスミスで提供される機能はどのようにしてリアルワールドの問題を解決するのに役立ちますか?

    -ランスミスの機能を使用することで、プロダクション監視と自動化を通じて、リアルワールドの問題を解決するための具体的なアプローチを提供できます。

  • ランスミスのプラットフォームはSaaSですか?

    -はい、ランスミスはSaaS(サービスとしてのソフトウェア)プラットフォームであり、ロギング、監視、テスト、評価を行えるサービスを提供しています。

Outlines

00:00

🚀 新機能紹介: Lang Smithの生産環境監視と自動化

この段落では、HarrisonがLang Chainの新しいシリーズの機能について語っています。Lang Smithは、ログ、監視、デバッグ、テスト、評価をするためのLLMシステムのOpsプラットフォームです。新機能は、生産環境の監視と自動化に特化しています。Lang Smithは、開発時だけでなく、アプリケーションがライブで生産環境で動作している時も、何が起こっているのかを把握するのに役立ちます。Harrisonは、これらの新機能を紹介し、それらに基づいて詳細な動画や実際のユースケースを解説する予定です。

Mindmap

Keywords

💡Lang Smith

Lang Smithは、ロギング、監視、デバッグ、テスト、評価をするためのLLM(Large Language Model)システムのオペレーションズプラットフォームです。このプラットフォームは、開発時だけでなく、アプリケーションが本番環境で稼働している際にも、何が起こっているかを理解するのに役立ちます。

💡プロダクションモニタリング

プロダクションモニタリングは、アプリケーションが本番環境で稼働しているときに、その状態を監視し、問題に対処するためのプロセスです。Lang Smithでは、新機能を追加して、プロダクションサービスの状況をより理解し、迅速に対応できるようにしています。

💡オートメーション

オートメーションは、データのフィルタリングされたサブセットを自動的に処理し、それに対してアクションを実行するプロセスです。Lang Smithでは、オートメーションを使用して、データセットに送信したり、注釈(Annotation)を作成したり、オンライン評価を実行したりすることができます。

💡フィルタリング

フィルタリングは、大量のログデータから、必要なサブセットを特定し、探索するプロセスです。Lang Smithでは、フィルタリング機能が強化されており、ユーザーは本番サービスのログを効果的に探索できます。

💡監視チャート

監視チャートは、アプリケーションの状態を集約的に可視化するツールです。Lang Smithで追加された監視チャートを使用することで、アプリケーションの全体像をより直感的に把握することができます。

💡スレッド

スレッドは、会話の異なるターンをグループ化し、一つのビューにまとめる機能です。特に、チャットのようなLLアプリケーションでは、スレッド機能を使って会話の流れを把握することが重要です。Lang Smithでは、スレッドレベルのビューが追加されました。

💡オンライン評価

オンライン評価は、プロンプトを定義し、トレースのサブセットに対して実行し、フィードバックを提供することで、本番トラフィックに対する自動評価を行う機能です。Lang Smithでは、オンライン評価を使用して、アプリケーションのパフォーマンスをリアルタイムで評価できます。

💡データセット

データセットは、アプリケーションから収集された情報を整理し、分析しやすい形式に保つためのデータの集合です。Lang Smithのオートメーション機能を使って、フィルタされたデータをデータセットに自動的に送信することができます。

💡注釈(Annotation)

注釈は、データやチャートに追加情報を付加するマーカーです。Lang Smithでは、注釈を作成して、特定のイベントや問題を追跡し、チームで共有することができます。

💡エンドツーエンドのユースケース

エンドツーエンドのユースケースとは、実際の問題を解決するために、複数の機能やプロセスを組み合わせて使用するシナリオです。Lang Smithでは、エンドツーエンドのユースケースを紹介して、ユーザーがプラットフォームをより効果的に活用できるようにしています。

💡SaaSプラットフォーム

SaaS(Software as a Service)プラットフォームは、ソフトウェアをサービスとして提供するモデルです。Lang SmithはSaaSプラットフォームであり、ロギング、監視、テスト、評価を含め、様々な機能をオンライン上で提供しています。

Highlights

Lang Smith is an llm systems Ops platform for logging, monitoring, debugging, testing, and evaluation of llm apps.

New features are being released focusing on production monitoring and automation.

Lang Smith is useful for understanding what's happening in your application during development and in live production.

The platform has added a robust filtering experience to easily explore subsets of increasing production logs.

Monitoring charts have been introduced to provide an aggregated view of application performance.

Threads feature has been added for a better chat user experience in LL applications by grouping conversation turns together.

Automations allow for automatic actions on filtered data subsets, such as sending data to a dataset or an annotation CU.

Online evaluation is a major new feature that enables defining prompts and leaving feedback for automatic evaluation of production traffic.

Lang Smith is a SaaS platform that can be used independently of Lang chain.

Users can sign up for a free account on smith.chain.com to utilize Lang Smith.

Detailed videos and end-to-end use case videos will be available to demonstrate the use of these new features.

The features aim to help users understand and take action based on the performance and issues within their applications.

The chat thread view provides a bird's eye perspective of conversations, enhancing UX for LL application users.

Annotation CU is a concept introduced for automations that will be explained in further detail.

Production monitoring and automations can solve real-world problems and improve the efficiency of llm app management.

The introduction of these features signifies a step forward in the comprehensive management and optimization of llm applications.

Transcripts

play00:00

hi Harrison from Lang chain here and

play00:04

today I want to talk about a series of

play00:06

features that we're releasing as part of

play00:09

Lang Smith so if you haven't used Lang

play00:12

Smith already it's our llm systems Ops

play00:16

platform for logging monitoring

play00:19

debugging testing evaluation of your llm

play00:23

apps and we're releasing a series of new

play00:26

features specifically around production

play00:28

monitoring and automation

play00:31

so lsmith is really handy for getting

play00:34

the sense of what's going on in your

play00:36

application and that doesn't just mean

play00:38

what's going on during development time

play00:40

or or in offline mode it also means

play00:42

what's going on when your application is

play00:45

live and in production and so we've

play00:47

added a bunch of new features to help

play00:50

you understand what's going on and then

play00:53

take action based on that so as a quick

play00:57

overview I'm going to talk about the

play00:59

features here

play01:00

and then we're going to have detailed

play01:01

videos on all of these features and then

play01:04

also some more endtoend use case videos

play01:06

on how to combine and use these features

play01:09

for very real

play01:11

situations so as an overview of what

play01:13

we'll be covering first we're going to

play01:15

talk about filtering so as you get more

play01:18

and more logs in your Production Service

play01:21

you need to be able to filter into

play01:23

subsets that you want to explore really

play01:25

easily and we've added a really good

play01:27

filtering

play01:28

experience we're then going to talk

play01:30

about some of the monitoring charts that

play01:32

we've added and all the things that you

play01:34

can do with them so this provides a

play01:36

really great way to get an aggregate

play01:38

view of what is going on in your

play01:41

application after that we're going to

play01:43

talk about threads so one of the main

play01:46

uxs for LL applications is chat and so

play01:51

being able to group different turns of

play01:53

the conversation together into a

play01:54

sensible View and and have a kind of

play01:57

like a great Bird's eyye view of that

play01:58

thread or or that conversation is really

play02:00

important and so we've added a a view

play02:03

specific not at the trace level um but

play02:06

at the thread

play02:08

level and finally we'll we'll dive into

play02:11

automations and so automations are

play02:13

basically ways of taking filtered

play02:15

subsets of data automatically and doing

play02:17

things with it so one thing that you can

play02:20

do with it is you can send it to a data

play02:22

set another thing you can do with it is

play02:24

you can send it to an annotation CU and

play02:26

I'll explain what an annotation CU is

play02:29

and then the Third thir thing you can do

play02:30

with this and this is a really big new

play02:31

feature we've added is online

play02:34

evaluation so with online evaluation you

play02:37

can define a prompt to run over some

play02:42

subset of traces and leave some feedback

play02:44

and automatically evaluate your runs

play02:47

that you see coming in to the production

play02:49

traffic so I'm going to cover all these

play02:51

things and then I'll also cover a few

play02:54

use cases and so what you can do with

play02:56

these and and and really like real world

play02:58

problems that you can solve with this

play03:00

concept of production monitoring and

play03:04

automations all of these features are

play03:07

part of lsmith which is our SAS platform

play03:09

for doing logging monitoring testing

play03:13

evaluation you can use Lang Smith

play03:15

whether you are using Lang chain or not

play03:17

so it is completely independent in order

play03:20

to sign up for an account you can go to

play03:22

smith. chain.com and you can sign up for

play03:25

an account for

play03:27

free you will probably want to do that

play03:29

before before we continue with the rest

play03:30

of this video once you've done that come

play03:33

back and jump into a future guide let's

play03:35

get

play03:37

started

Rate This

5.0 / 5 (0 votes)

Related Tags
ロギング監視自動化プロダクションデバッグテスト評価フィルタリングチャットUXオンライン評価SaaSプラットフォーム
Do you need a summary in English?