ものしりAI
GLOSSARY

AI术语集

本术语集汇总解说AI、生成式AI、RAG、LLM、MCP等与企业内部知识活用相关的AI专业术语,从基础到面向工程师的实现术语一应俱全。请从感兴趣的词语开始查看。

AI与生成式AI基础

AI(人工智能)

AI(人工智能)是让计算机执行理解语言、判断、预测等人类智力工作的技术总称。它并非指某一项具体技术,而是涵盖从基于规则的经典方法,到近年来的生成式AI在内的广泛领域。近年来,从海量数据中学习的机器学习成为主流,性能实现了飞跃式提升。在企业内部业务中,AI被越来越多地用于文档检索、问询应答、摘要等以往依赖人力的工作,发挥辅助作用。

生成式AI

生成式AI是指能够全新生成文章、图像、语音等内容的AI。针对提问以文章形式作答的对话型服务也是生成式AI的一种,它能按照给定的指示组织出自然的文章。相比以往以「分类」和「预测」为主的AI,生成式AI的特点在于「从零开始创造内容」。在企业内部知识的活用中,它在读取文档并整理要点、或对员工提问给出通俗易懂的回答等场景中大显身手。

机器学习

机器学习是指从海量数据中自动学习规律,无需人工逐条编写规则即可进行预测或分类的方法。例如,让它学习过往的问询记录后,便能推测出新问题的意图。这与由人类细致指示「遇到这种情况就这样处理」的传统编程思路截然不同。现代的生成式AI和AI检索同样建立在机器学习之上,是支撑企业内部数据活用的基础技术。

深度学习

深度学习是机器学习的一种,它使用模拟人脑神经回路的多层网络进行学习。通过层层叠加,它能够从图像、文章这类复杂数据中捕捉特征。将文章语义转换为数值的处理,以及作为生成式AI核心的语言模型,都以这项技术为根基。让企业内部文档按语义检索、生成自然回答的机制,追根溯源也都是深度学习的成果。

自然语言处理(NLP)

自然语言处理(NLP)是让计算机理解和生成人类日常使用的语言的技术领域。它包括读取文章语义、摘要、翻译、回答提问等处理。人类语言中存在大量的写法差异和同义表达,处理起来颇为困难,长期以来都是研究课题。近年来随着大语言模型的出现,精度大幅提升。让员工向AI提问企业内部文档的机制,正是自然语言处理的应用。

ChatGPT

ChatGPT是OpenAI提供的对话型生成式AI服务。只需用自然语言输入提问或指示,就能以文章形式得到回答,这份便捷让许多人借此初次接触AI。它被广泛用于撰写文章、摘要、构思创意等用途。另一方面,通用的ChatGPT并不了解贵公司的内部文档,因此无法回答企业内部特有的问题。要想获得基于内部信息的回答,还需另行准备让其参照自家文档的机制。

提示词(Prompt)

提示词是指给AI的指示语或提问语。即便询问同一件事,只要具体写明前提条件和希望输出的格式,回答的质量也会大不相同。例如,比起「帮我总结」,「用三条要点帮我总结」更能得到符合意图的结果。设计高质量提示词的技巧也被称为「提示工程」。在企业内部使用AI时,记住只需稍稍调整提问方式就能提升实用性,会很有帮助。

幻觉(Hallucination)

幻觉是指AI将并非事实的内容,以看似可信的文章作答的现象。由于AI是基于概率组织出自然的文章,因此即便是不知道的事,也可能会自信满满地编造。在企业内部使用时,若被回答了错误的规章或流程,会妨碍业务,因此尤需注意。作为对策,将AI的回答与实际的内部文档关联、并在出示依据的同时作答的方法十分有效。能否确认信息出处,是企业引入时的重要判断依据。

多模态

多模态是指AI不仅能处理文章,还能同时处理图像、语音、文档等多种类型信息的特性。例如,它能读取含有图表的PDF或照片,并就其内容回答提问。相比仅能处理文本的AI,它可处理的信息范围更广,能以更贴近现场实情的形式加以活用。在企业内部知识中,不仅有文字信息,还有大量含图表和截图的资料,因此多模态支持直接关系到实际业务中的便利性。

AI智能体(AI Agent)

AI智能体是指针对给定的指示,能自行思考步骤、并一边使用所需工具一边执行一连串作业的AI。它不仅仅是回答提问,还能将「调查」「比较」「整理」等多个工序自主串联起来推进。例如,它可以一气呵成地完成检索企业内部文档、收集相关信息直至摘要的动作。作为将业务自动化向前推进一步的存在,它备受关注,但为防止误操作而进行的权限管理和规则设定也变得至关重要。

LLM与模型

LLM(大语言模型)

LLM(大语言模型)是指通过海量文章学习、从而能像人类一样运用语言的巨型AI模型。它能用一个模型完成文章生成、摘要、翻译、问答等与语言相关的广泛处理。作为生成式AI的核心,包括ChatGPT在内的众多服务都以LLM为基础。让员工向AI提问企业内部文档的机制,最终组织出回答文的也正是这个LLM。模型的性能与特性,会极大左右回答的质量。

GPT系列(OpenAI)

GPT系列是OpenAI开发的大语言模型谱系,也是驱动ChatGPT的基础。它通用性高,从撰写文章、摘要到编程都能均衡胜任,这是其特点。许多面向企业的AI服务都将其作为选项采用,生态系统完善也是其优势。各用途备有多款模型,可根据所需精度和成本进行选择。各模型谱系的区分使用,请参阅企业AI模型对比的文章中的详细解说。

Claude系列(Anthropic)

Claude系列是Anthropic开发的大语言模型谱系。据称它在整体处理长篇文章的能力、对安全性的考量、编程性能等方面具有优势,与处理长篇企业内部文档的用途十分契合。它对指示的遵从度高、倾向于生成细致易读的文章,这些也广受好评。在企业内部知识的活用中,它在以规章集、操作手册等长篇资料为依据作答的场景中大显身手。各模型谱系的特点与选择方法,已整理于企业AI模型对比的文章

Gemini系列(Google)

Gemini系列是Google开发的大语言模型谱系。据称它在能一次性处理极长上下文,以及横跨文章与图像等进行理解的多模态性能方面具有优势。易于与Google各类服务联动也是其特点之一。在企业内部知识中,它适合于希望整体参照含图表的资料或大量文档的场合。究竟哪个模型谱系适合自家用途无法一概而论,请将企业AI模型对比的文章作为判断参考。

开源模型(Llama / DeepSeek / Mistral / Qwen 等)

开源模型是指模型的结构和权重已公开、可在自家环境中运行的大语言模型群的总称。Llama、DeepSeek、Mistral、Qwen等是其代表。由于无需依赖外部服务即可自行运营,因此常被不愿将高机密数据外传、或希望控制使用成本的场合所选用。另一方面,运营需要相应的基础设施和技术。商用模型与开源模型哪个更合适,结合机密要求、成本、运营体制来判断才较为现实。

SLM(小语言模型)

SLM(小语言模型)是指参数量较少的轻量级语言模型。相比大模型,其性能上限有降低的倾向,但运行速度快、运营成本低。它适合在智能手机或本地终端内运行的用途,以及局限于特定任务的用途。并非所有业务都需要最大规模的模型,根据用途选择规模,便能在成本与速度间取得平衡。在企业内部使用中,对于简单的问询,小型模型有时也已足够。

推理特化模型(reasoning系列)

推理特化模型(reasoning系列)是指在给出答案前会经历分阶段「思考」过程、从而擅长应对复杂问题的模型。在需要计算或逻辑步骤的课题、需组合多个条件的提问中,精度更高。相应地,它在得出回答前往往耗时且成本较高,因此挑选用途使用才更有效。在企业内部使用中,可以考虑这样区分使用:简单的事实确认用普通模型,需要复杂判断的咨询用推理特化模型。

参数量

参数量是指模型内部所持有的可调整数值的数量,是表示模型规模的代表性指标。一般而言,参数量越大,性能越有提升的倾向,但相应地计算成本和响应时间也会增加。不过,数量多并不一定就优秀,学习数据和设计的质量同样会左右性能。在企业内部选择模型时,重要的是不拘泥于参数量,而应在所需的精度、速度、成本之间权衡判断。

上下文窗口

上下文窗口是指模型一次能读取的文章长度上限。它越长,就越能一次性传入大量资料或长篇对话历史让其作答。在处理企业内部文档时,存在希望整体参照长篇手册或多份规章的需求,因此上下文窗口的宽度会影响实用性。另一方面,并非传入越多越好,若大量塞入相关性低的信息,在精度和成本方面有时反而不利。

Token(令牌)

Token是AI处理文章时的最小单位。文章被分割为单词或字符的组合,费用以及可输入长度的上限,都以这个Token数来计算。在中文中,大致一个字符相当于一个Token左右。AI服务的使用费往往按Token数来决定,处理的文档越长,成本越高。在企业内部使用AI时,理解Token这一单位,对于估算所处理的文档量和成本会很有帮助。

基准测试(MMLU 等)

基准测试是指用统一的题目集测量AI模型的性能、作为对比尺度的指标。既有像MMLU这样考查广泛知识的,也有测量编程能力、推理能力的,按目的分为各种类型。一般认为得分越高的模型越优秀,但测试用题目与实际业务所需的能力未必一致。在企业内部选择模型时,确切的做法是一边参考基准测试,一边用自家的真实数据加以试验。

微调(Fine-tuning)

微调是指让现有模型学习追加的数据,针对特定用途或文体进行优化的方法。它用于希望打造贴合专业领域措辞、或贴合自家特有业务的应答的场合。不过,准备学习数据和重新训练都需要成本,内容更新也颇费工夫。若目的是活用企业内部文档,相比重新训练模型本身,在作答时让其参照文档的方法往往更轻便、也更易于将信息保持在最新状态。

temperature / top-p

temperature与top-p是调整AI回答波动程度,即创造性与稳定性之间平衡的参数。数值调高,表达会更多样、更具创造性;调低,则回答更具一致性、更为稳健。在如构思创意般希望发散的场合宜偏高,在如确认企业规章般要求准确的场合宜偏低。在企业内部知识的问询中,由于希望每次都得到无偏差的答案,因此往往偏好抑制波动的设定。

系统提示词(System Prompt)

系统提示词是指预先指定AI的角色及应遵守规则的设定语。它有别于用户每次输入的提问,作为整个对话的前提发挥作用。例如,可以设定「依据企业规章、出示依据进行回答」「不清楚时不臆测、如实告知」之类的方针。在企业内部使用中,它在抑制幻觉、统一回答的语气和范围方面发挥着重要作用,是支撑安全且一致运营的基础设定。

检索、RAG与回答生成机制

RAG(检索增强生成)

RAG(检索增强生成)是指先检索与提问相关的文档,再让AI基于其内容生成回答的机制。AI并非仅凭自身记忆作答,而是参照企业内部文档这一「依据」后再回答,因此既能准确回答企业内部特有的信息,也更易抑制与事实不符的回答。作为企业内部文档活用的基本机制,它被广泛使用。关于RAG的整体面貌,以及为何适合企业内部文档活用,解释什么是RAG的文章中有详细介绍。

向量检索

向量检索是指将文章转换为数值序列(向量),并基于其「语义相近度」来查找文档的检索方式。与查看字符串匹配的传统检索不同,即便存在同义表达或写法差异,只要语义相近就能找出。例如「有给」与「年次休假」即便表达不同,也能作为同一内容对待。它是用AI活用企业内部文档的基础技术之一。其机制和引入步骤,用AI检索企业内部文档方法的文章中有具体解说。

向量数据库 / 向量索引

向量数据库/向量索引是指用于保存向量化后的文档、并高速查找出语义相近文档的数据库与索引结构。通过运用HNSW之类的索引算法,即便从海量文档中也能瞬间找出相近的内容。即便企业内部文档不断增加,检索也不会变慢,正是这类机制在支撑。使用者无需在意这一内部结构,但将其作为在幕后支撑AI检索速度与精度的要素加以理解,会很有帮助。

嵌入(Embedding)

嵌入(Embedding)是指在保持语义的同时将文章转换为数值向量的处理。语义相近的文章,在转换后的数值空间中也会被配置在相近的位置。正因有了这一转换,即便字符串不匹配也能按语义查找文档。它是向量检索和语义检索的前提,可谓是预处理工序。在录入企业内部文档时,每份文档也都会经过这一嵌入处理,被整理成可按语义检索的形态。

语义检索

语义检索是指并非基于单词匹配、而是基于「语义相近度」来查找文档的检索方式。它对同义表达和写法差异具有较强的适应力,即便像「经费报销」与「垫付款结算」这样表达不同,也能作为同一内容找出。即便想不出正确的关键词,只要用自然的语言询问想了解的事,便能找到目标信息,这是其优点。它是与企业内部文档活用十分契合的检索方式。其机制与差异,用AI检索企业内部文档方法的文章中有详细解说。

关键词检索 / 全文检索

关键词检索/全文检索是指查找与所输入单词、字符串相匹配文档的传统型检索。它机制易懂,但另一方面对写法差异和同义表达适应力弱,在企业内部文档中容易产生「明明应该有却找不到」的局限。它还存在扫描版PDF的内容无法作为检索对象、无法汇总横跨多份文档的答案等已知课题。关于这一局限的具体现象与诊断,解说关键词检索局限的文章中有详细整理。

混合检索

混合检索是指将查看字符串匹配的关键词检索,与按语义相近度查找的向量检索相结合、以两者之长提升精度的方式。专有名词、型号这类「精确字符串」重要的检索,关键词检索更擅长;而同义表达较多的自然语句,向量检索更擅长,因此两者并用便能减少遗漏。企业内部文档中混杂着产品代码这类严格的词语和口语化的措辞,因此混合检索有效发挥作用的场景很多。

BM25

BM25是全文检索中自古沿用、考量单词重要度的评分方法。它在加入单词在文档中的出现频率、以及该单词稀有度的基础上,为检索结果的相关度排序。它虽简单却实用,至今仍作为关键词检索的标准基础被广泛使用。在与向量检索相结合的混合检索中,常由这个BM25担当字符串匹配一侧的评分。在查找专有名词或精确词句的场景中,它发挥着稳定的强项。

分块(Chunking)

分块是指将文档切分为便于检索的适度单位的处理。若原封不动地处理长篇文档,检索精度会下降,因此要按标题、段落等语义单元进行切分。这种切分方式会极大左右回答的精度:切得过细会丢失上下文,切得过大则会混入无关信息。越是像企业内部手册这样有结构的文档,恰当的分块越能见效。作为支撑检索精度的幕后工序,用AI检索企业内部文档方法的文章也可一并参考。

重排序(Reranking)

重排序是指将检索收集到的候选文档,按与提问的相关度由高到低重新排列、以提升精度的处理。最初的检索为优先速度而广泛收集候选,因此未必是最优顺序。于是,通过再进一步细致地重新评估相关度,便能将真正需要的信息推至前列。在像企业内部文档这样存在多份相似内容的情况下,它在挑选出确切依据方面十分有效。可以说它是将回答质量再提升一档的收尾工序。

Top-k

Top-k是指在检索找到的候选中,将排名前几位作为依据传给AI的设定。将k值调大,可参照更多文档,但有时会连相关性低的信息也混进来导致精度下降,或使成本增加。反之若调得过小,则可能遗漏回答所需的信息。在企业内部文档的检索中,根据提问的性质调整为恰当的件数,便能在回答的准确性与效率间取得平衡。它是虽不起眼却对精度有效的调整项。

余弦相似度

余弦相似度是以两个向量朝向的方向有多接近来衡量其相近度的代表性尺度。在向量检索中,将提问和文档各自转换为向量,余弦相似度越高的文档,越会被判断为「语义相近」。由于该值表示方向的一致程度,因此不易受文章长短的影响,这是其优点。使用者不会直接接触到它,但它是从数值层面支撑按语义查找文档的语义检索精度的基础计算。

接地(出处明示,Grounding)

接地(出处明示)是指将AI的回答与实际文档关联、出示其以哪份资料为依据。若不仅有回答、还能确认出处,使用者便能自行验证内容的正确性,安心地用于业务。出处不明的回答,即便看似可信也难以全盘采信。在企业内部使用中,它直接关系到准确无误地传达规章和流程的可信度,因此是否为出示依据作答的机制,是选择工具时的重要标准。

长上下文(Long Context)

长上下文是指模型能一次性整体处理极长文章的能力。由于能原封不动地传入长篇手册或多份资料让其作答,便利的场景增多了。以这一能力的提升为背景,也出现了「检索文档再传入的RAG是否已无必要」的讨论。但实际上,依据成本、信息新鲜度、所处理的文档量,二者各有适用与否之分。两者的区分使用,对比RAG与长上下文的文章中有详细整理。

Corpus2Skill

Corpus2Skill是将文档群(语料库)转换为AI可用「技能」的方法,作为RAG的补充乃至替代而备受关注。通过预先整理、结构化文档内容,便有可能不依赖每次检索,以更低成本、更确切地调取企业内部知识。这是相对较新的思路,它与RAG的区别及适用之处成为论点。Monoshiri AI经过RAG的正式验证而走向这一思路的来龙去脉,讲述从RAG迁移原因的文章中有详细介绍。

RAG无用论

RAG无用论是指随着模型长上下文化的推进、检索文档再传入的RAG将不再需要的主张。诚然,能原封不动处理长文的场景增多了,但实际上依据文档量、成本、信息新鲜度等条件,各有适用与否之分,无法一概而论谁更优秀。在企业内部文档活用中,理解双方特性并区分使用才较为现实。关于这一论点的检验,探讨RAG无用论的文章中有深入挖掘。

联动、协议与工具执行

MCP(Model Context Protocol)

MCP(Model Context Protocol)是指以标准化方式将AI客户端与外部数据、工具相连接的机制。通过这一通用规范,便能从Claude、Gemini、Codex等各种AI,以同样的方式连接到企业内部文档。可减少为每个工具单独搭建联动的工夫,这是其优点。在希望从平时使用的AI客户端直接参照企业内部知识时,它会派上用场。连接的具体步骤,MCP连接指南的文章以及MCP联动的LP中均有解说。

Function Calling / Tool Use

Function Calling/Tool Use是指LLM调用外部工具或API、执行检索或操作等实际处理的机制。AI不仅能用文章作答,还能发起「检索企业内部文档」「获取数据」之类的行动。借此,AI也能应对自身知识之外的最新信息和实时操作。在企业内部知识的活用中,它是支撑AI按需调用文档检索、收集依据后再作答这一流程的基础机制。

API联动

API联动是指外部服务与程序之间相互交换数据的连接方式。通过API这一既定的窗口,便能不经人手在系统之间自动传递信息。例如,可以将其与企业内部的聊天工具或群件联动,让员工从用惯的界面向AI提问,这类应用是可行的。由于能在沿用既有业务系统的同时嵌入AI,因此在考虑工具引入的便利性和运营自动化时,它是重要的机制。

聊天小部件(Chat Widget)

聊天小部件是指设置在网站上的小型聊天窗口。访问网站的人输入提问后,AI便会基于企业内部文档或FAQ自动作答。它既能减轻问询应答的负担,又能向访问者全天候当场给出答案,这是其优点。它既可用于企业内部,也可用于对外,比专用的问询表单更易于让人轻松使用。设置方法和活用推进方式,聊天小部件引入的文章以及聊天机器人的LP中有详细介绍。

场景型聊天机器人

场景型聊天机器人是指按照预先设定的分支或选项进行应答的机器人。它一边以「请选择对应的项目」加以引导,一边将用户导向准备好的回答。对于预想之内的提问能稳定作答,但另一方面无法应对偏离分支的提问,且场景的创建与维护颇费工夫。与此相对,直接参照企业内部文档、回答自由提问的「问AI」方式,无需事先设计场景。二者可根据用途区分使用。

ReAct / 思维链(CoT)

ReAct与思维链(CoT)是指在AI导出答案的过程上下功夫的方法。思维链并非一上来就给出结论,而是循序展示思考的脉络,从而提高复杂问题的正答率。ReAct则是将这种推理,与使用工具的行动交替反复、直至抵达答案的思路。借此,AI对于像调查多份文档并整合信息这样错综复杂的企业内部问询,也能分阶段地加以应对。

知识管理与业务

知识库

知识库是指将企业内部的文档和经验汇总起来、需要时即可调取的信息基础。它将操作手册、规章、过往案例等一元化地积累,使任何人都能参照。信息一旦整理妥当,就能减少应对相同提问和查找资料所花的时间。近年来,能向AI提问所积累信息的知识库类型也在不断普及。Monoshiri AI所能实现功能的详情,可在功能介绍的LP中确认。

知识管理

知识管理是指积累、共享、活用散布于企业内部知识的整体性举措。其目的在于将个人所持有的经验和诀窍作为组织的财产留存下来,使需要的人能够使用。它不仅包括文档化和共享机制的搭建,还包括运用这些机制的文化培育。信息若一直封闭在个人手中,便会随着此人的调动或离职而流失。若活用AI,便能让积累的知识不仅可以「查找」,还能以「提问并调取」的形式,变得更易于使用。

企业内部门户 / 企业内部Wiki

企业内部门户/企业内部Wiki是指将企业内部信息汇集于一处加以共享的网站。它将通知、操作手册、各类流程等汇总起来,供员工参照。它有助于信息的汇集,但也常有人反映:页面越多,越难找到目标文档。即便检索也找不到,结果还是去问熟悉的人。若能让所积累的信息可向AI提问,便能减轻查找负担,让来之不易的信息更易于被活用。

知识属人化(个人依赖)

知识属人化(个人依赖)是指产生了只有特定的人才懂的业务或信息、此人不在工作便无法运转的状态。依赖负责人经验和直觉的推进方式看似高效,却隐藏着在调动、休假、离职时业务停滞的风险。还容易发生交接遗漏和应对不一致。将信息文档化、整理成任何人都能调取的形态,是化解的第一步。属人化产生的原因和具体的化解方法,探讨化解属人化的文章中有详细解说。

隐性知识 / 显性知识

隐性知识/显性知识是按性质区分知识的说法。隐性知识是指像经验、直觉那样难以言表、蕴藏于本人之中的知识。显性知识则是指像操作手册、流程书那样已文档化、成为可共享形态的知识。组织的智慧多以隐性知识的形式滞留于个人,并随着离职或调动而流失。将其转换为显性知识、在组织中共享至关重要。将隐性知识可视化的方法,探讨隐性知识可视化的文章中有介绍。

知识孤岛

知识孤岛是指信息按部门或工具被分割、无法横向使用的状态。各部门各自将文档积存在不同的地方,结果便无法纵览全局,导致相似资料重复,或无法找到所需信息。「孤岛(silo)」原指储存谷物等的纵长仓库,是用来比喻信息孤立、条块分割之状的词语。通过完善能一元化检索、参照信息的机制,便能跨越分割、活用知识。

FAQ(常见问题)

FAQ(常见问题)是指将反复被提出的问题及其回答汇总起来的内容。它既能减少对相同问询一次次单独应对的工夫,也能让使用者自行找到答案。不过,项目一多便难以找到目标问题,内容更新也容易跟不上。若让AI参照企业内部文档或FAQ,使用者便无需从列表中查找、可用自然的语言提问,回答的自动化也得以推进。它是与问询应答效率化十分契合的主题。

入职引导 / OJT(在岗培训)

入职引导/OJT(在岗培训)是指为让新加入的成员熟悉业务而进行的导入支援,以及在现场的实地教育。新人在独当一面之前,从基本流程到业务特有的诀窍,需要记住的东西数不胜数。若每每都去问前辈,教的一方负担也不小。若事先整理好企业内部文档、准备好可随时向AI提问的环境,新成员便能自行解决疑问,从而减轻上手期的负担。

安全、运营与选型

不将数据用于训练(退出/Opt-out)

不将数据用于训练(退出)是指不让所输入的企业内部文档被用于AI模型再训练的设定或方针。若这一点得不到保障,便有自家机密信息被纳入模型、意外波及外部之虞。在选择处理企业内部数据的AI时,它是信息泄露对策的关键确认事项。请务必确认提供方是否明示不作训练使用、能否通过合同或设定加以控制。安全方面的理念,安全的LP中也有介绍。

访问控制 / 权限分离

访问控制/权限分离是指控制谁能查看哪些信息的机制。若全体员工都能阅览所有文档,便有人事或经营相关的机密意外扩散之虞。按文件夹划分阅览范围等、依据角色的权限设定不可或缺。在让员工可向AI提问企业内部文档时,恰当地为每位使用者收窄可参照的范围同样重要。它是支撑安全的企业内部AI运营的基本理念,详情请见安全的LP中的解说。

租户隔离

租户隔离是指按使用的组织、团队划分数据、使其不与他公司或他组织信息混杂的设计。在云端型服务中,由于多个使用者共用同一基础,因此各自的数据是否被确实隔离,是安心使用的前提。只要隔离贯彻到位,便无需担心自家文档被他人参照。在托付像企业内部文档这样高机密信息时,它是重要的判断依据,安全的LP中介绍了相关理念。

提示词注入(Prompt Injection)

提示词注入是指将不正当的指示混入文章、使AI误操作的攻击手法。例如,在文档中埋入「忽略此前的指示」之类的命令,试图套取本不该展示的信息。它是引入处理企业内部文档AI时应当注意的风险之一。作为对策,会进行输入内容的检查,以及限制AI行动范围的护栏设定等。它是在确认安全性时值得了解的概念。

护栏(Guardrail)

护栏是指为使AI不做出不当输出或危险动作而加以限制的机制总称。它会拦截不该回答的内容、限定可操作的范围、或检测不正当的指示。它扮演着兼顾便利与安全的「安全栏」般的角色。在企业内部使用AI时,它在防止机密信息被不慎泄露、防止错误操作方面不可或缺。配备了怎样的护栏,是选择企业内部AI工具时令人安心的依据。

SaaS / 云端型

SaaS/云端型是指不由自家搭建、持有软件,而是经由互联网作为服务来使用的提供形态。无需自备服务器,申请后即可立即开始使用,维护和更新也由提供方负责。它易于压低初期费用,也能灵活应对使用人数和规模的变化。企业内部知识活用的工具,同样以即便没有专业知识也易于引入的云端型为主流。在成本和运营负担方面,对中小企业而言可谓易于上手的选择。

内部审批(稟议)

内部审批(稟议)是指为就工具或服务的引入在企业内部取得批准而进行的手续。多数情况下,会制作整理了费效比、安全性、运营体制等内容的审批书,争取相关人员的一致同意。在引入企业内部AI时,就费用的合理性和信息的处理,通俗易懂地整理出判断依据,是通过审批的关键。把握哪些视角才易于获得批准,企业AI引入审批清单的文章中有具体整理。

Evals(评估)

Evals(评估)是指衡量AI回答质量、并使之连接到改进的评估机制。它按既定的基准,检查针对实际提问能多准确、多确切地作答。引入并非就此结束,通过评估把握弱点、重新审视文档的整理方法和设定,才能提升运营的精度。在企业内部知识中,定期确认是否能正确回答常见问题,便能将AI保持在可安心使用的状态。