基于LangChain手工测试用例转Web自动化测试生成工具

在传统编写 Web 自动化测试用例的过程中，基本都是需要测试工程师，根据功能测试用例转换为自动化测试的用例。市面上自动生成 Web 或 App 自动化测试用例的产品无非也都是通过录制的方式，获取操作人的行为操作，从而记录测试用例。整个过程类似于

[图片上传失败...(image-23545f-1724927282952)]

但是通常录制出来的用例可用性、可维护性都不强，而且依然需要人手工介入录制的过程。

在 LLM 问世之后，我们便在探索，是否有第二种可能性，由大模型执行功能测试用例，生成自动化测试用例？

应用价值

测试工程师在编写用例的过程中，将操作步骤明确的表达出来。即可通过大模型将功能测试用例可以直接转为 Web 自动化测试用例。极大的节省了人力与资源。

实践演练

实现原理

整个实现原理如下图所示：

[图片上传失败...(image-125816-1724927282952)]

实现思路

测试用例规范与要求

如果想要将功能用例转换为自动化测试用例，那么对功能测试用例则需要清晰，明确的表达出来每个操作步骤。如果测试用例本身就表达的含糊不清，那么自然大模型是无法识别它需要进行的具体的操作步骤的。

如下所示，为一个登录功能的测试步骤。在这些测试步骤中，具体打开哪些页面，输入哪些信息，点击哪些按钮都清晰的表达了出来。


1. 打开 https://litemall.hogwarts.ceshiren.com/#/login?redirect=%2Fdashboard
2. 输入用户名 hogwarts
3. 输入密码 test12345
4. 点击登录按钮
5. 进入主页，获取此时的url
6. 执行完成，退出浏览器

通过 AGENT 执行功能测试用例。

大模型本身是不具备任何执行能力或生成能力的，它只会”思考“，但是通过 LangChain 的 Agent，可以将一些”工具”外挂到大模型身上。

那么如果要执行这些功能测试用例，大模型就需要具备执行用例的能力。而我们要做的事情，就是将 tools（工具包），外挂到大模型上面。

相关知识点： Agent、 tools

封装好 web 的底层工具


class WebAutoFramework:

    def __init__(self):
        self.driver = None
        self.element = None

    def init(self):
        if not self.driver:
            self.driver = webdriver.Chrome()
            self.driver.implicitly_wait(5)

    def open(self, url):
        self.init()

        self.driver.get(url)
        return self.source()

    def source(self):
        return self.driver.execute_script(
            """
            var content="";
            document.querySelectorAll('button').forEach(x=> content+=x.outerHTML);
            document.querySelectorAll('input').forEach(x=> content+=x.outerHTML);
            //document.querySelectorAll('table').forEach(x=> content+=x.outerHTML);
            return content;
            """
        )

    def click(self):
        """
        点击当前的元素
        :return:
        """
        self.element.click()
        sleep(1)
        return self.source()

    def send_keys(self, text):
        self.element.clear()
        self.element.send_keys(text)
        return self.source()

    def find(self, locator):
        print(f"find css = {locator}")
        element = self.driver.find_element(by=By.CSS_SELECTOR, value=locator)
        self.element = element
        return self.source()

    def quit(self):
        self.driver.quit()

    def get_current_url(self):
        print(f"当前的url为{self.driver.current_url}")
        return self.driver.current_url

创建工具以及其说明，并且将工具绑定到工具包中


web = WebAutoFramework()
@tool
def open(url: str):
    """
    使用浏览器打开特定的url，并返回网页内容
    """
    r = web.open(url)
    return r

@tool
def find(css: str):
    """定位网页元素"""
    return web.find(css)

@tool
def click(css: str = None):
    """以css的方式定位网页元素后点击"""
    web.find(css)
    return web.click()

@tool
def send_keys(css, text):
    """定位到css指定的元素，并输入text"""
    web.find(css)
    return web.send_keys(text)

@tool
def sleep(seconds: int):
    """等待指定的秒数"""
    time.sleep(seconds)

@tool
def quit():
    """退出浏览器"""
    web.quit()

@tool
def get_current_url():
    """获取当前的url"""
    return web.get_current_url()

tools = [open, quit, get_current_url, find, click, send_keys]

声明 Agent，并将tools传递过去：

 web_agent = create_structured_chat_agent(llm, tools, prompt)
# Create an agent executor by passing in the agent and tools
web_agent_executor = AgentExecutor(
    agent=web_agent, tools=tools,
    verbose=True,
    return_intermediate_steps=True,
    handle_parsing_errors=True)

执行 Agent:

r = web_agent_executor.invoke({"input": query})

记录执行步骤

在 Agent 的配置中，可以要求 agent 将所有的执行步骤记录下来。而执行记录会记录在返回结果中的intermediate_steps中。

而我们则需要将这些步骤取出来，按照我们的需求记录下来。

# 获取执行结果
r = agent.invoke({"input": query})
# 获取执行记录
steps = r["intermediate_steps"]
steps_info = []
# 遍历执行步骤
for step in steps:
    action = step[0]
    if isinstance(action, AgentAction):
        steps_info.append({'tool': action.tool, 'input': action.tool_input})

生成自动化测试用例。

拥有执行步骤之后，可以将执行步骤传递给大模型，然后让大模型根据执行步骤直接生成 web 自动化测试用例。


prompt = PromptTemplate.from_template("""
你是一个web自动化测试工程师，主要应用的技术栈为pytest + selenium。
以下为web自动化测试的测试步骤，测试步骤由json结构体描述
{step}

{input}
""")

AGENT 结合 CHAIN


import json

from langchain import hub
from langchain.agents import create_structured_chat_agent, AgentExecutor
from langchain.globals import set_debug
from langchain_core.agents import AgentAction
from langchain_core.output_parsers import StrOutputParser
from langchain_core.prompts import PromptTemplate
from langchain_core.runnables import RunnablePassthrough
from langchain_openai import ChatOpenAI

from web.selenium_tools import tools

set_debug(True)

prompt = hub.pull("hwchase17/structured-chat-agent")
llm = ChatOpenAI()
web_agent = create_structured_chat_agent(llm, tools, prompt)
# Create an agent executor by passing in the agent and tools
web_agent_executor = AgentExecutor(
    agent=web_agent, tools=tools,
    verbose=True,
    return_intermediate_steps=True,
    handle_parsing_errors=True)

query = """
你是一个自动化测试工程师，接下来需要根据测试步骤，
每一步如果定位都是根据上一步的返回的html操作完成
执行对应的测试用例，测试步骤如下
1\. 打开 https://litemall.hogwarts.ceshiren.com/#/login?redirect=%2Fdashboard
2\. 输入用户名 hogwarts
3\. 输入密码 test12345
4\. 点击登录按钮
5\. 进入主页，获取此时的url
6\. 执行完成，退出浏览器
"""

def web_execute_result(_):
    # 获取执行结果
    r = web_agent_executor.invoke({"input": query})
    # 获取执行记录
    steps = r["intermediate_steps"]
    steps_info = []
    # 遍历执行步骤，获取每一步的执行步骤以及输入的信息。
    for step in steps:
        action = step[0]
        if isinstance(action, AgentAction):
            steps_info.append({'tool': action.tool, 'input': action.tool_input})
    return json.dumps(steps_info)

prompt_testcase = PromptTemplate.from_template("""
你是一个web自动化测试工程师，主要应用的技术栈为pytest + selenium。
以下为web自动化测试的测试步骤，测试步骤由json结构体描述

{step}

{input}

""")

chain = (
        RunnablePassthrough.
        assign(step=web_execute_result)
        | prompt_testcase
        | llm
        | StrOutputParser()
)

print(chain.invoke({"input": "请根据以上的信息，给出对应的web自动化测试的代码"}))

执行效果

最后，自动生成的 Web 自动化测试用例效果如下：

[图片上传失败...(image-9c2312-1724927282951)]

总结

Web 自动化测试用例生成工具需求说明。
如何通过 LangChain 实现 Web 自动化测试用例生成工具。

获取更多软件测试技术资料/面试题解析，请点击！

[图片上传失败...(image-a84dea-1724927282951)]