-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathtest-tfjs-usbcam.html
169 lines (140 loc) · 5.76 KB
/
test-tfjs-usbcam.html
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
<!DOCTYPE html>
<html lang="ja">
<head>
<meta charset="UTF-8">
<meta name="viewport" content="width=device-width, initial-scale=1.0">
<title>TensorFlow.js リアルタイム物体検出</title>
<style>
canvas {
border: 1px solid black;
}
</style>
</head>
<body>
<!-- カメラ映像を表示するための video 要素 -->
<video id="video" width="640" height="480" autoplay></video>
<!-- 推論結果を描画するための canvas -->
<canvas id="output-canvas"></canvas>
<!-- 推論時間を表示するための要素 -->
<div id="inference-time" style="margin-top: 10px;"></div>
<!-- TensorFlow.js を CDN から読み込む -->
<script src="https://cdn.jsdelivr.net/npm/@tensorflow/tfjs"></script>
<script>
const VIDEO_INPUT_WIDTH = 640; // ビデオの入力幅
const VIDEO_INPUT_HEIGHT = 480; // ビデオの入力高
const MODEL_INPUT_WIDTH = 640; // モデルの入力幅
const MODEL_INPUT_HEIGHT = 480; // モデルの入力高
const classColors = [
"#FF0000", "#00FF00", "#0000FF", "#FFFF00", "#FF00FF", "#00FFFF", "#FFA500", "#800080",
"#008080", "#A52A2A", "#808000", "#000080", "#FFC0CB", "#800000", "#808080", "#C0C0C0",
"#FFD700", "#ADFF2F", "#87CEEB", "#DC143C", "#FF4500", "#2E8B57", "#4682B4", "#6A5ACD",
"#708090"
];
let model; // モデルをロードして保持する変数
// カメラ映像を取得する関数
async function setupCamera() {
const video = document.getElementById('video');
const stream = await navigator.mediaDevices.getUserMedia({
video: { width: VIDEO_INPUT_WIDTH, height: VIDEO_INPUT_HEIGHT }
});
video.srcObject = stream;
return new Promise((resolve) => {
video.onloadedmetadata = () => {
resolve(video);
};
});
}
// TensorFlow.js モデルのロード
async function loadModel() {
try {
model = await tf.loadGraphModel('tfjs_model_480x640/model.json'); // 適切なパスに変更
return model;
} catch (err) {
console.error('モデルのロードに失敗しました:', err);
alert('モデルのロードに失敗しました。');
}
}
// フレームを TensorFlow.js 用に前処理する関数
function preprocessImage(videoElement) {
let tensor = tf.browser.fromPixels(videoElement).expandDims(0).toFloat();
// RGB を BGR に変換
tensor = tf.reverse(tensor, axis=[-1]); // 最後の次元 (チャネル) を反転
return tensor;
}
// 推論の実行と時間計測
async function runInference(inputTensor) {
try {
const startTime = Date.now();
const output = await model.executeAsync(inputTensor);
const endTime = Date.now();
const inferenceTime = endTime - startTime;
document.getElementById('inference-time').textContent = `推論時間: ${inferenceTime} ミリ秒`;
return output;
} catch (err) {
console.error('推論に失敗しました:', err);
alert('推論に失敗しました。');
}
}
const threshold = 0.35;
// 推論結果に基づいてバウンディングボックスを描画
function renderBoundingBoxes(output, videoElement) {
const canvas = document.getElementById('output-canvas');
const width = videoElement.videoWidth;
const height = videoElement.videoHeight;
canvas.width = width;
canvas.height = height;
const ctx = canvas.getContext('2d');
ctx.clearRect(0, 0, canvas.width, canvas.height);
ctx.drawImage(videoElement, 0, 0, canvas.width, canvas.height);
// 元のconsole.warn()を保存
const originalWarn = console.warn;
// 特定のワーニングメッセージを抑制
console.warn = (message) => {
if (!message.includes("This model execution did not contain any nodes with control flow")) {
originalWarn(message);
}
};
const boxesData = output.arraySync(); // テンソルのデータを取得
// レンダリング除外クラスID
const excludedIds = [1, 2, 3, 4, 5, 6, 8, 9, 10, 11, 12, 13, 14, 15, 22, 23];
for (let i = 0; i < boxesData.length; i++) {
const [batchno, classId, score, x1, y1, x2, y2] = boxesData[i];
if (excludedIds.includes(classId)) {
continue;
}
if (score > threshold) {
const scaleX = canvas.width / MODEL_INPUT_WIDTH;
const scaleY = canvas.height / MODEL_INPUT_HEIGHT;
const boxColor = classColors[classId % classColors.length];
ctx.strokeStyle = boxColor;
ctx.lineWidth = 2;
ctx.strokeRect(x1 * scaleX, y1 * scaleY, (x2 - x1) * scaleX, (y2 - y1) * scaleY);
ctx.font = '16px Arial';
ctx.fillStyle = boxColor;
ctx.fillText(`Class: ${classId} Score: ${score.toFixed(2)}`, x1 * scaleX, y1 * scaleY - 5);
}
}
}
// リアルタイムでカメラの映像を処理する関数
async function detectFrame(videoElement) {
tf.engine().startScope();
const inputTensor = preprocessImage(videoElement);
const output = await runInference(inputTensor);
renderBoundingBoxes(output, videoElement);
requestAnimationFrame(() => detectFrame(videoElement)); // 次のフレームを処理
inputTensor.dispose(); // ここでメモリを解放
output.dispose(); // ここでメモリを解放
tf.engine().endScope();
}
// 初期化関数
async function init() {
await setupCamera();
await loadModel();
const video = document.getElementById('video');
detectFrame(video); // フレームごとに検出処理を実行
}
// ページ読み込み時に初期化
window.onload = init;
</script>
</body>
</html>