]> rtime.felk.cvut.cz Git - hercules2020/kcf.git/blob - src/kcf.h
Implement sub-gird angle estimation
[hercules2020/kcf.git] / src / kcf.h
1 #ifndef KCF_HEADER_6565467831231
2 #define KCF_HEADER_6565467831231
3
4 #include <opencv2/opencv.hpp>
5 #include <vector>
6 #include <memory>
7 #include "fhog.hpp"
8
9 #include "complexmat.hpp"
10 #ifdef CUFFT
11 #include "cuda_error_check.hpp"
12 #include <cuda_runtime.h>
13 #endif
14
15 #include "cnfeat.hpp"
16 #include "fft.h"
17 #include "pragmas.h"
18
19 class Kcf_Tracker_Private;
20 struct ThreadCtx;
21
22 struct BBox_c
23 {
24     double cx, cy, w, h, a;
25
26     inline cv::Point2d center() const { return cv::Point2d(cx, cy); }
27
28     inline void scale(double factor)
29     {
30         cx *= factor;
31         cy *= factor;
32         w  *= factor;
33         h  *= factor;
34     }
35
36     inline cv::Rect get_rect()
37     {
38         return cv::Rect(int(cx-w/2.), int(cy-h/2.), int(w), int(h));
39     }
40
41 };
42
43 class KCF_Tracker
44 {
45     friend ThreadCtx;
46     friend Kcf_Tracker_Private;
47 public:
48     bool m_debug {false};
49     enum class vd {NONE, PATCH, RESPONSE} m_visual_debug {vd::NONE};
50     const bool m_use_scale {true};
51     const bool m_use_color {true};
52     const bool m_use_subpixel_localization {true};
53     const bool m_use_subgrid_scale {true};
54     const bool m_use_subgrid_angle {true};
55     const bool m_use_cnfeat {true};
56     const bool m_use_linearkernel {false};
57     const int p_cell_size = 4;            //4 for hog (= bin_size)
58
59     /*
60     padding             ... extra area surrounding the target           (1.5)
61     kernel_sigma        ... gaussian kernel bandwidth                   (0.5)
62     lambda              ... regularization                              (1e-4)
63     interp_factor       ... linear interpolation factor for adaptation  (0.02)
64     output_sigma_factor ... spatial bandwidth (proportional to target)  (0.1)
65     cell_size           ... hog cell size                               (4)
66     */
67     KCF_Tracker(double padding, double kernel_sigma, double lambda, double interp_factor, double output_sigma_factor, int cell_size);
68     KCF_Tracker();
69     ~KCF_Tracker();
70
71     // Init/re-init methods
72     void init(cv::Mat & img, const cv::Rect & bbox, int fit_size_x = -1, int fit_size_y = -1);
73     void setTrackerPose(BBox_c & bbox, cv::Mat & img, int fit_size_x = -1, int fit_size_y = -1);
74     void updateTrackerPosition(BBox_c & bbox);
75
76     // frame-to-frame object tracking
77     void track(cv::Mat & img);
78     BBox_c getBBox();
79     double getFilterResponse() const; // Measure of tracking accuracy
80
81 private:
82     Fft &fft;
83
84     // Initial pose of tracked object in internal image coordinates
85     // (scaled by p_downscale_factor if p_resize_image)
86     BBox_c p_init_pose;
87
88     // Information to calculate current pose of the tracked object
89     cv::Point2d p_current_center;
90     double p_current_scale = 1.;
91     double p_current_angle = 0.;
92
93     double max_response = -1.;
94
95     bool p_resize_image = false;
96
97     const double p_downscale_factor = 0.5;
98     const double p_floating_error = 0.0001;
99
100     const double p_padding = 1.5;
101     const double p_output_sigma_factor = 0.1;
102     double p_output_sigma;
103     const double p_kernel_sigma = 0.5;    //def = 0.5
104     const double p_lambda = 1e-4;         //regularization in learning step
105     const double p_interp_factor = 0.02;  //def = 0.02, linear interpolation factor for adaptation
106     cv::Size p_windows_size;              // size of the patch to find the tracked object in
107     cv::Size fit_size;                    // size to which rescale the patch for better FFT performance
108
109     const uint p_num_scales = m_use_scale ? 5 : 1;
110     const double p_scale_step = 1.03;
111     double p_min_max_scale[2];
112     std::vector<double> p_scales;
113
114     const uint p_num_angles = 3;
115     const int p_angle_step = 10;
116     std::vector<double> p_angles;
117
118     const int p_num_of_feats = 31 + (m_use_color ? 3 : 0) + (m_use_cnfeat ? 10 : 0);
119     cv::Size feature_size;
120
121     std::unique_ptr<Kcf_Tracker_Private> d;
122
123     class Model {
124         cv::Size feature_size;
125         uint height, width, n_feats;
126     public:
127         ComplexMat yf {height, width, 1};
128         ComplexMat model_alphaf {height, width, 1};
129         ComplexMat model_alphaf_num {height, width, 1};
130         ComplexMat model_alphaf_den {height, width, 1};
131         ComplexMat model_xf {height, width, n_feats};
132         ComplexMat xf {height, width, n_feats};
133
134         // Temporary variables for trainig
135         MatScaleFeats patch_feats{1, n_feats, feature_size};
136         MatScaleFeats temp{1, n_feats, feature_size};
137
138
139
140         Model(cv::Size feature_size, uint _n_feats)
141             : feature_size(feature_size)
142             , height(Fft::freq_size(feature_size).height)
143             , width(Fft::freq_size(feature_size).width)
144             , n_feats(_n_feats) {}
145     };
146
147     std::unique_ptr<Model> model;
148
149     class GaussianCorrelation {
150       public:
151         GaussianCorrelation(uint num_scales, uint num_feats, cv::Size size)
152             : xf_sqr_norm(num_scales)
153             , xyf(Fft::freq_size(size), num_feats, num_scales)
154             , ifft_res(num_scales, size)
155             , k(num_scales, size)
156         {}
157         void operator()(ComplexMat &result, const ComplexMat &xf, const ComplexMat &yf, double sigma, bool auto_correlation, const KCF_Tracker &kcf);
158
159       private:
160         DynMem xf_sqr_norm;
161         DynMem yf_sqr_norm{1};
162         ComplexMat xyf;
163         MatScales ifft_res;
164         MatScales k;
165     };
166
167     //helping functions
168     void scale_track(ThreadCtx &vars, cv::Mat &input_rgb, cv::Mat &input_gray);
169     cv::Mat get_subwindow(const cv::Mat &input, int cx, int cy, int size_x, int size_y, double angle) const;
170     cv::Mat gaussian_shaped_labels(double sigma, int dim1, int dim2);
171     std::unique_ptr<GaussianCorrelation> gaussian_correlation;
172     cv::Mat circshift(const cv::Mat &patch, int x_rot, int y_rot) const;
173     cv::Mat cosine_window_function(int dim1, int dim2);
174     cv::Mat get_features(cv::Mat &input_rgb, cv::Mat &input_gray, cv::Mat *dbg_patch, int cx, int cy, int size_x, int size_y, double scale, double angle) const;
175     cv::Point2f sub_pixel_peak(cv::Point &max_loc, cv::Mat &response) const;
176     double sub_grid_scale(uint index);
177     void resizeImgs(cv::Mat &input_rgb, cv::Mat &input_gray);
178     void train(cv::Mat input_rgb, cv::Mat input_gray, double interp_factor);
179     double findMaxReponse(uint &max_idx, cv::Point2d &new_location) const;
180     double sub_grid_angle(uint max_index);
181 };
182
183 #endif //KCF_HEADER_6565467831231